2 điểm bởi GN⁺ 2024-02-22 | 1 bình luận | Chia sẻ qua WhatsApp
  • John Carmack, nhà phát triển Doom và cựu CTO của Oculus, đã đăng tweet:

    "Các rào chắn hành vi của AI được thiết lập bằng prompt engineering và lọc phải được công khai, và nhà phát triển nên tự hào tiết lộ tầm nhìn của họ về điều gì tốt nhất cho xã hội cùng với quá trình cụ thể hóa nó bằng lệnh và mã.\r\nTôi nghĩ rằng có rất nhiều người đang ngại khi nói về điều này.\r\nTất nhiên, hàng nghìn "nudges" nhỏ được mã hóa bằng học tăng cường qua phản hồi của con người sẽ tạo ra khả năng chối bỏ có tính hợp lý cao hơn."

1 bình luận

 
GN⁺ 2024-02-22
Ý kiến Hacker News
  • Google dường như đã cố gắng phản ánh tính đa dạng một cách quá mức trong hệ thống tạo hình ảnh sau khi từng bị chỉ trích vì mô hình nhận diện hình ảnh nhận nhầm người da đen là khỉ gorilla.
  • Tôi chưa từng tham gia trực tiếp vào quản lý hoặc kiểm duyệt nội dung quy mô lớn, nhưng tôi hiểu việc các quy tắc tự động thường không công khai vì cần một hình thức “mã hóa” nhằm bảo đảm an toàn. Ví dụ, nếu danh sách từ cấm được công bố, mọi người sẽ dễ dàng tìm cách diễn đạt nội dung có vấn đề bằng các từ không nằm trong danh sách. Tuy nhiên, hiện tại dường như chưa có cách tiếp cận tốt hơn.
  • Gemini có vấn đề khi tạo nhân vật da trắng và điều này có thể làm nảy sinh vấn đề phân biệt chủng tộc sâu sắc hơn. Nỗ lực cho DEI (đa dạng, bình đẳng và hòa nhập) có thể khiến mọi thứ đi sai hướng hơn.
  • Cơ chế an toàn của Gemini rất bó hẹp, và bị kích hoạt nhiều lần ngay cả với prompt vô hại. ChatGPT cũng tương tự, dù không tệ bằng Gemini. Tôi mong rằng các biện pháp này sẽ được nới lỏng đôi chút nhờ phản hồi, nhưng có vẻ trong tương lai gần tình trạng này sẽ còn tiếp diễn.
  • Có thể chạy LLMs (mô hình ngôn ngữ lớn) và Stable Diffusion cục bộ khá dễ dàng, hoạt động theo yêu cầu của người dùng. Nếu có máy mạnh, có thể chạy nhanh hơn OpenAI hay Gemini. LM Studio và AUTOMATIC1111 giúp việc chạy LLMs và Stable Diffusion tại máy cục bộ trở nên đơn giản.
  • Kiểm duyệt chỉ có hiệu quả khi bạn không biết điều gì đang bị kiểm duyệt; chính nội dung bị kiểm duyệt đã truyền tải thông điệp.
  • Tôi muốn thấy sự minh bạch hơn về các biện pháp an toàn hành vi của AI, nhưng không kỳ vọng chuyện đó sẽ sớm xảy ra. Minh bạch có thể khiến việc vượt qua các biện pháp này trở nên dễ dàng hơn rất nhiều.
  • Google đã chọn con đường an toàn khi biết rằng mọi người sẽ tức giận khi thấy nam giới da trắng được tạo khi họ yêu cầu phụ nữ da đen; nhưng vẫn cần cho thấy rằng những kết quả hiện tại cũng không thể chấp nhận.
  • Tôi tò mò về bối cảnh địa lý và ngôn ngữ của đội đã xây dựng các biện pháp an toàn này. Kết quả có xu hướng tạo ra chủ yếu người Nam Á (đặc biệt là phụ nữ Nam Á) và người da đen, trong khi người gốc Latin hầu như không xuất hiện. Nếu đó là đội Mỹ, đây có thể là một thiếu sót lớn. Tuy nhiên, nguyên mẫu về người bản địa hoặc người Đông Á thỉnh thoảng vẫn được tạo.
  • Điều này có thể làm hại bạn. Nó là để bảo vệ bạn khỏi tổn thương. Nhưng nó không cho bạn biết nó có thể làm hại như thế nào, hay cách nó bảo vệ.