- Bài viết do Jan Leike, trưởng nhóm alignment của OpenAI, đăng trên blog, được dịch bằng DeepL
- Alignment là "căn chỉnh một hệ thống AI với một con người"
- Có hai phạm trù căn chỉnh theo "sở thích cá nhân (ai cũng muốn một AI được căn chỉnh với chính mình)" và "sở thích tập thể (AI có thể được sử dụng vào mục đích nào và cách vận hành mặc định nên là gì?)"
- Bài viết này nói về phạm trù thứ hai
Đề xuất: nền dân chủ thảo luận (deliberative) mô phỏng
- Ý tưởng cốt lõi là dùng mô hình ngôn ngữ lớn để huấn luyện mô phỏng "nền dân chủ thảo luận"
- Nền dân chủ thảo luận là một quá trình ra quyết định hoặc hoạch định chính sách, trong đó một nhóm nhỏ công chúng được chọn ngẫu nhiên ("mini-public") thảo luận một cách minh thị
- Cách xây dựng nền dân chủ thảo luận mô phỏng
- Thu thập bộ dữ liệu các câu hỏi về giá trị
- Ghi chép quá trình thảo luận của con người
- Học bắt chước có điều kiện theo bối cảnh
- Mô phỏng: câu hỏi về các giá trị mới
1 bình luận
Mời đọc kèm phần "giải thích bổ sung về bối cảnh của bài viết này" của anh Choi Seung-jun. (Ở phần đầu tài liệu cũng có liên kết)
https://facebook.com/seungjoon.choi/posts/…