1 điểm bởi GN⁺ 2023-11-28 | 1 bình luận | Chia sẻ qua WhatsApp

Bữa tiệc biến đổi hình ảnh DALL·E

  • DALL·E cung cấp một sân chơi cho việc biến đổi hình ảnh.
  • Các chủ đề hình ảnh được người dùng yêu thích gồm có “gnome”, “người Siberia lớn tuổi”, “những con mèo kỳ quặc”, v.v.
  • Có thể bắt đầu tạo hình ảnh dựa trên prompt khởi đầu bằng cách sử dụng khóa API OpenAI.

Thiết lập nâng cao

  • Thông qua các thiết lập nâng cao như số lần lặp, người dùng có thể điều chỉnh quá trình tạo hình ảnh.
  • Có thể tùy biến bằng cách dùng prompt thị giác của GPT-4 để thay đổi prompt gốc, hoặc làm cho nó vui hơn, kỳ quái hơn, độc đáo hơn, hay biến mọi thứ thành mèo.

Ý kiến của GN⁺

  • Điểm quan trọng nhất trong bài này là có thể dùng DALL·E để tạo ra nhiều hình ảnh khác nhau và biến đổi chúng theo cách người dùng mong muốn.
  • Khả năng tạo hình ảnh sáng tạo và được cá nhân hóa mang lại trải nghiệm thú vị cho mọi người, đồng thời có thể xem đây là một ví dụ cho thấy sự phát triển của công nghệ và tiềm năng của trí tuệ nhân tạo.

1 bình luận

 
GN⁺ 2023-11-28
Ý kiến trên Hacker News
  • Việc nghịch với prompt và xem có thể tạo ra những gì qua một chuỗi hình ảnh thực sự rất thú vị. Lấy cảm hứng từ một bài đăng Twitter gần đây, tôi đã thử một thiết lập tăng dần "cường độ" cho mỗi prompt. Chủ đề bắt đầu từ gợi ý của một đứa trẻ khiến tôi kinh ngạc khi thấy một con dê bình thường dần leo thang thành nỗi kinh hoàng vũ trụ ngày tận thế. Liên kết: dalle.party
  • Prompt tùy chỉnh mà cá nhân tôi thích: cân nhắc kỹ mọi chi tiết của hình ảnh để khái niệm hóa, bao gồm phong cách, màu sắc và ánh sáng. Ở bước cuối, nén tất cả thành một đoạn văn duy nhất để tóm tắt ý tưởng bằng những đặc điểm nổi bật nhất và ngôn ngữ cực kỳ chính xác. Liên kết: dalle.party
  • Chơi với các khái niệm tương phản cũng rất vui. Bắt đầu từ một con mèo đơn giản, nó tiến hóa thành một quả dưa chuột đang nằm thư giãn, rồi cuối cùng chuyển sang một thế giới đối lập. Liên kết: dalle.party
  • Điều này gợi tôi nhớ đến trò chơi tiệc tùng tên là 'Telestrations'. Người chơi luân phiên vẽ rồi viết lại những gì mình thấy, và thật vui khi xem kết quả trong lúc đoán bức vẽ tiếp theo sẽ là gì. Sẽ thật tuyệt nếu có một chế độ xem thay thế hiển thị hình ảnh cùng prompt kế tiếp. Bạn có thể chuyển sang chế độ di động hoặc thay đổi kích thước cửa sổ để đọc prompt trước rồi xem hình.
  • Tôi đã kỳ vọng vào một quá trình tiến hóa công nghệ dần dần hơn là sự thoái lui công nghệ, nhưng trên thực tế nó nhanh chóng chệch sang một vùng siêu thực. Prompt khởi đầu: "sự lai ghép giữa đầu máy hơi nước tương lai và cỗ máy bay của Da Vinci". Kết quả: dalle.party
  • Có vẻ như các mô hình image-to-text hoàn toàn không biết một bức ảnh thực sự chứa gì. Chúng trông giống như đang đối sánh các mẫu trong dữ liệu huấn luyện. Điều đó cho thấy khi mô hình render hình ảnh từ văn bản thì có vẻ như nó "hiểu" điều mô hình muốn, nhưng theo chiều ngược lại thì lại rất xa mới được gọi là "hiểu".
  • Tôi chưa thử, nhưng đoán rằng thứ này giống với trò chơi thương mại có bán tên là Scrawl. Người chơi chuyền giấy cho nhau, biến phần mô tả của người bên cạnh thành hình vẽ hoặc làm ngược lại, rồi lại chuyền tiếp. Liên kết: boardgamegeek.com
  • Khi thử với prompt mở đầu "trí tuệ nhân tạo đang vẽ chính những bức tranh của mình", kết quả luôn cho ra cảnh một robot đang vẽ trên toan. 4 hình đầu là tranh về robot, 3 hình tiếp theo là các thiên hà, và 2 hình cuối là tranh phong cảnh. Liên kết: dalle.party
  • Thật thú vị khi thấy một số prompt và chủ đề cụ thể được giữ tương đối ổn định. Ví dụ, trường hợp "gnome" thì ổn định, còn trường hợp "con mèo đang giảng bài cho con chuột" thì nhanh chóng trôi sang một vùng siêu thực kỳ quái.
  • Hơi thất vọng vì kết quả khá nhiễu, nhưng bản thân ý tưởng này rất cuốn hút. Liên kết: dalle.party