1 điểm bởi GN⁺ 2023-09-21 | 1 bình luận | Chia sẻ qua WhatsApp
  • DALL·E 3 là phiên bản mới nhất của hệ thống chuyển văn bản thành hình ảnh của OpenAI, với khả năng hiểu sắc thái và chi tiết được cải thiện hơn so với các phiên bản trước.
  • Hệ thống này hướng tới mục tiêu chuyển đổi chính xác prompt văn bản thành hình ảnh, đồng thời khắc phục vấn đề thường gặp ở các hệ thống text-to-image hiện đại là bỏ qua từ ngữ hoặc mô tả.
  • DALL·E 3 được xây dựng dựa trên ChatGPT, cho phép người dùng sử dụng ChatGPT như một đối tác brainstorming và công cụ cải thiện prompt.
  • Khi nhận được ý tưởng, ChatGPT sẽ tạo prompt chi tiết cho DALL·E 3, và DALL·E 3 sẽ hiện thực hóa ý tưởng đó dưới dạng hình ảnh.
  • Hệ thống này dự kiến sẽ được cung cấp cho khách hàng ChatGPT Plus và Enterprise vào tháng 10, và các hình ảnh được tạo ra sẽ thuộc sở hữu của người dùng để họ sử dụng theo ý muốn.
  • Các biện pháp an toàn đã được áp dụng để hạn chế khả năng DALL·E 3 tạo ra nội dung bạo lực, người lớn hoặc gây thù ghét, đồng thời cũng có cơ chế từ chối các yêu cầu về hình ảnh của nhân vật công chúng.
  • OpenAI đang nghiên cứu các cách giúp mọi người nhận biết hình ảnh do AI tạo ra, trong đó có công cụ bộ phân loại nguồn gốc.
  • DALL·E 3 được thiết kế để từ chối các yêu cầu tạo hình ảnh theo phong cách của những nghệ sĩ còn sống, và các nhà sáng tạo có thể loại trừ hình ảnh của mình khỏi quá trình huấn luyện các mô hình tạo ảnh trong tương lai.
  • Quá trình phát triển DALL·E 3 có sự tham gia của một đội ngũ lớn gồm các nhà nghiên cứu, nhà phát triển sản phẩm, chuyên gia an toàn và chuyên gia truyền thông.

1 bình luận

 
GN⁺ 2023-09-21
Ý kiến trên Hacker News
  • Thông báo về việc sắp ra mắt DALL·E 3, phiên bản mới của trình tạo ảnh AI
  • Thảo luận về giá trị của việc thông báo trước khi ra mắt đối với DALL·E 3, sản phẩm vẫn chưa được phát hành
  • Một người dùng đã tạo khoảng 7.000 hình ảnh bằng phiên bản trước là DALL·E 2 và chia sẻ chúng trên một trang web
  • Việc tích hợp ChatGPT và DALL·E 3 có thể là một bước phát triển quan trọng, có tác động lớn đến các công ty SaaS chuyển văn bản thành hình ảnh
  • Một số người dùng nêu ra vấn đề bản quyền, cho rằng DALL·E 3 đã được huấn luyện bằng các tác phẩm có bản quyền mà không được cho phép
  • Có suy đoán về tác động tiềm tàng của DALL·E 3 đối với các nền tảng nghệ thuật AI khác như Midjourney và Stable Diffusion
  • Nhấn mạnh tầm quan trọng của việc tuyển chọn trong nghệ thuật AI, với lập luận rằng vẫn cần con mắt nghệ thuật để chọn ra những hình ảnh đẹp
  • Câu hỏi đặt ra là liệu DALL·E 3 có còn sử dụng dữ liệu "huấn luyện" có bản quyền mà không có sự đồng ý hay không
  • Một số người dùng nghi ngờ rằng DALL·E 3 có thể là đợt chạy thử cho khả năng đa phương thức của GPT-4 vì được tích hợp chặt chẽ với ChatGPT
  • Thông báo này làm dấy lên sự phấn khích và kỳ vọng trong cộng đồng công nghệ, đồng thời OpenAI cũng được ghi nhận vì đã thúc đẩy lĩnh vực này tiến lên phía trước