Imagen - mô hình diffusion text-to-image của Google
(imagen.research.google)- Mô hình AI tạo ra hình ảnh chân thực nhờ khả năng hiểu ngôn ngữ ở mức độ sâu
- Trong các đánh giá với người dùng, tạo ra những hình ảnh được ưa thích hơn so với DALL-E 2 của OpenAI
→ Xét về chất lượng và mức độ căn chỉnh giữa hình ảnh-văn bản - Chỉ công bố bài báo nghiên cứu và các hình ảnh ví dụ
→ Quyết định không công bố phiên bản demo có thể sử dụng từ bên ngoài do các vấn đề đạo đức, v.v.
2 bình luận
Hôm qua ở hiệu sách tôi thấy cuốn Alice ở xứ sở thần tiên có chèn các khung hình tĩnh từ hoạt hình Disney làm minh họa, nên tôi tò mò nếu đưa từng cảnh của Alice ở xứ sở thần tiên vào một mô hình như vậy thì nó sẽ tạo ra kết quả thế nào.
DALL·E 2 ra mắt
DALL-E 2 hoạt động như thế nào?