DeepFloyd IF - Mô hình Text-to-Image mã nguồn mở
(github.com/deep-floyd)- Mô hình tạo ảnh mới của Stability AI
- Khả năng hiểu ngôn ngữ cao hơn so với các mô hình hiện có và tạo ra hình ảnh quang thực
- Kết hợp bộ mã hóa văn bản Frozen dựa trên T5 Transformer với mô-đun khuếch tán pixel 3 giai đoạn
- 64x64, 256x256, 1024x1024px
- Điểm Zero-shot FID là 6.66 (bộ dữ liệu COCO)
Chưa có bình luận nào.