19 điểm bởi xguru 2023-10-30 | 2 bình luận | Chia sẻ qua WhatsApp
  • So sánh 3 mô hình với cùng một prompt theo các khía cạnh: độ chính xác chủ đề, độ chính xác phong cách, tính nhất quán và đạo đức (Ethics)

Nhiếp ảnh: Con người

  • Hiện tại trong lĩnh vực chụp ảnh, Midjourney đang dẫn đầu, nhưng Firefly 2 bám ngay phía sau với khoảng cách rất nhỏ
  • Nếu muốn ảnh chân dung ít bị cách điệu hơn và tự nhiên hơn, từ nay nên cân nhắc Firefly 2
  • Không nên dùng DALL-E 3 cho mục đích chụp ảnh

Nhiếp ảnh: Con người theo phong cách

  • Gần đây người ta tạo rất nhiều hình ảnh con người mang tính phong cách
  • Vì các prompt này được tùy biến riêng cho Midjourney nên có thể có chút thiên lệch
  • Tuy nhiên, có một số điểm chính:
    • Midjourney hoạt động tốt nhất khi được đưa các prompt phức tạp hơn và cho thấy tính nhất quán rất mạnh
    • Midjourney vượt trội trong việc tạo ra các tổ hợp phức tạp về chất liệu, bố cục và ánh sáng
    • DALL-E có vẻ gặp khó khăn trong việc tích hợp ánh sáng cho người da màu, khiến độ chính xác của kết quả giảm xuống
    • Firefly tạo ra kết quả đa dạng nhất khi không có yêu cầu rõ ràng về tính đa dạng
    • Khi thay thế cho các buổi chụp ảnh sáng tạo hơn, cả Firefly và DALL-E 3 đều có thể gặp khó khăn trong việc đạt được mức chất lượng và tính nhất quán như mong muốn

Nhiếp ảnh: Vật thể

  • Tôi nghĩ Midjourney nhìn chung thể hiện tính nhất quán của vật thể chân thực nhất
  • Firefly và DALL-E đang bắt kịp, nhưng sở thích phong cách của các mô hình này chắc chắn sẽ ảnh hưởng đến kết quả

Minh họa

  • Xét về minh họa, cả ba đều đã tiến bộ đáng kể, nhưng nếu muốn có kết quả nhiều sắc thái thì Midjourney vẫn là lựa chọn tốt nhất
  • Tuy vậy, nên thử nghiệm nhiều mô hình và tinh chỉnh theo phong cách riêng của mình

Typography

  • Khả năng tạo ra từ ngữ chính xác chỉ mới trở nên khả thi gần đây
  • Trong tất cả các bài kiểm tra đã thực hiện, chỉ DALL-E 3 là tái hiện từ ngữ một cách trung thực như một thực thể hoàn chỉnh
  • Từ trong trường hợp đặc biệt này là "thiết kế", và tính nhất quán được duy trì ổn định trong mọi thử nghiệm

Kết luận

  • Bối cảnh rõ ràng đang thay đổi, nhưng những điểm cốt lõi tôi muốn nhấn mạnh là:
  • Adobe rõ ràng đang thu hẹp khoảng cách trong lĩnh vực nhiếp ảnh và đang trở thành một đối thủ mạnh
  • DALL-E 3 là trình tạo duy nhất có thể tạo typography ở mức hợp lý (ngoại trừ Ideogram)
    • DALL-E 3 vượt trội trong việc tạo minh họa, và khi kết hợp với khả năng tạo từ ngữ, tôi nghĩ nó có tiềm năng trở thành một "trình tạo hình ảnh cho clipart" xét về quy mô và phong cách khái quát hóa
    • Phù hợp cho hình ảnh cơ bản hoặc tạo ảnh trong lúc làm việc khác (thông qua ChatGPT), nhưng có lẽ sẽ chưa sớm trở thành một công cụ thiết kế cực kỳ tinh vi
  • Midjourney tiếp tục tạo ra những bức ảnh chân thực và nhất quán nhất.
    • Về khả năng kiểm soát sáng tạo, Midjourney là vô đối

2 bình luận

 
hhkkkk 2023-10-30

Sao lại bỏ StableDiffusion?
Là vì Midjourney à

 
kuroneko 2023-10-30

Khi dùng DALL-E 3, tôi thấy việc nó thể hiện chữ rất rõ ràng thật sự quá ấn tượng.
Nhưng có vẻ hiện tại chất lượng tổng thể vẫn là Midjourney tốt nhất.