Căn chỉnh AI là gì - nghiên cứu căn chỉnh AI nhằm điều chỉnh các hệ thống AI phù hợp với những mục tiêu, sở thích hoặc nguyên tắc đạo đức mà con người mong muốn. Khi một hệ thống AI đạt được mục tiêu đã định, nó được xem là đã được căn chỉnh. Một hệ thống AI bị căn chỉnh sai có thể rất giỏi trong việc hoàn thành một số mục tiêu, nhưng lại không đạt được mục tiêu mà con người thực sự dự định.
Gần đây, OpenAI đã công bố kết quả nghiên cứu "Language models can explain neurons in language models" (các mô hình ngôn ngữ có thể giải thích các nơ-ron trong mô hình ngôn ngữ), và theo một góc nhìn nào đó, nghiên cứu này cũng có thể được hiểu là "để hiểu AI thì cần đến AI".
Tiến xa hơn, có vẻ như để giải quyết "vấn đề căn chỉnh" mà OpenAI thường xuyên nhắc đến, chúng ta cũng sẽ cần đến AI.
Vậy thì AI có thể đánh giá "sự căn chỉnh giữa AI và con người" hay không? Nếu có thể, bạn có muốn điều đó xảy ra không?
1 bình luận
Dù có làm vậy đi nữa thì có lẽ cũng sẽ bị đủ kiểu tổ chức xã hội phản đối vì đủ thứ lý do.