Các mô hình ngôn ngữ lớn học những kỹ năng ngoài dự kiến nhanh đến mức nào?
- Một nghiên cứu mới về năng lực của các mô hình ngôn ngữ lớn (Large Language Models, LLMs) cho rằng cái gọi là 'năng lực tăng vọt' thực ra phát triển dần dần và có thể dự đoán được.
- Các nhà nghiên cứu mô tả những năng lực này như hành vi 'tăng vọt', ví như hiện tượng chuyển pha trong vật lý khi chất lỏng biến thành băng.
- Tuy nhiên, nhóm nghiên cứu tại Đại học Stanford cho rằng sự xuất hiện đột ngột của những năng lực này chỉ là hệ quả của cách các nhà nghiên cứu đo lường hiệu năng của LLM.
Đo lường hiệu năng của các mô hình ngôn ngữ lớn
- Các mô hình ngôn ngữ lớn phân tích những tập dữ liệu văn bản khổng lồ để tìm ra các liên kết giữa những từ thường xuyên xuất hiện cùng nhau.
- Kích thước của mô hình được đo bằng số lượng tham số, và càng có nhiều tham số thì LLM càng có thể tìm ra nhiều liên kết hơn.
- GPT-2 có 1,5 tỷ tham số, GPT-3.5 có 350 tỷ, và GPT-4 sử dụng 1,75 nghìn tỷ tham số.
Sự phát triển dần dần của các năng lực ngoài dự kiến
- Nhóm nghiên cứu tại Đại học Stanford cho rằng năng lực của LLM không xuất hiện một cách đột ngột và khó đoán, mà phát triển dần dần và có thể dự đoán được.
- Ví dụ, trong phép cộng số có ba chữ số, GPT-3 và LAMDA không thể tính đúng khi số lượng tham số còn ít, nhưng khi tham số tăng lên thì đột nhiên có thể thực hiện phép cộng.
- Thay vì đánh giá LLM chỉ bằng độ chính xác, nhóm nghiên cứu sử dụng cách đo có chấm điểm từng phần và phát hiện rằng LLM dần dần dự đoán đúng thứ tự của các chữ số.
Quan điểm của các nhà khoa học khác
- Một số nhà khoa học khác chỉ ra rằng nghiên cứu này không hoàn toàn xóa bỏ khái niệm 'tăng vọt'.
- Vẫn chưa rõ tiêu chí đo lường nào, hoặc cách nào có thể dự đoán khi nào hiệu năng của LLM sẽ cải thiện mạnh.
- Một số nhà khoa học cho rằng các báo cáo trước đây về hiện tượng 'tăng vọt' là chính xác, và nhấn mạnh rằng với những năng lực như số học thì đáp án đúng mới là tất cả.
Ý kiến của GN⁺
- Nghiên cứu này có thể tạo ảnh hưởng quan trọng tới các cuộc thảo luận về độ an toàn và những rủi ro tiềm ẩn của trí tuệ nhân tạo. Nếu năng lực của LLM phát triển theo cách có thể dự đoán, đây có thể là một chỉ dấu quan trọng cho việc phát triển và quản lý AI an toàn.
- Khi kết quả nghiên cứu được áp dụng vào phát triển AI thực tế, các nhà phát triển cần nhận thức tầm quan trọng của cách đo lường hiệu năng và phải thiết kế các phương pháp đánh giá tinh vi hơn.
- Bài viết này có thể giúp hiểu những thay đổi và tiến bộ đang diễn ra ở tuyến đầu của nghiên cứu AI, đặc biệt khi nó đưa ra một góc nhìn mới về cách đánh giá hiệu năng của các mô hình AI.
- Từ góc nhìn phản biện, cũng cần thừa nhận rằng kết quả nghiên cứu không giải thích được mọi sự cải thiện hiệu năng của tất cả LLM, và ở các mô hình lớn hơn, phức tạp hơn thì hiện tượng 'tăng vọt' vẫn có thể xảy ra.
- Liên quan đến công nghệ này, dòng GPT của OpenAI đã được sử dụng rộng rãi trên thị trường, và nghiên cứu này có thể truyền cảm hứng cho việc phát triển những LLM khác tương tự GPT.
1 bình luận
Ý kiến Hacker News
Một vài vấn đề liên quan đến nghiên cứu
Khó khăn của việc dự đoán tương lai
Sự thay đổi kết quả khi thay đổi tiêu chí đo lường
Tiêu đề bài báo: "Are Emergent Abilities of Large Language Models a Mirage?"
Quan sát về sự thay đổi đột ngột của năng lực
Cách tiếp cận chấm điểm từng phần và huấn luyện mô hình
Sự xuất hiện dần dần của năng lực
Giới hạn của mô hình ngôn ngữ lớn (Large Language Models, LLMs)
Sự lẫn lộn về tiêu chí đo lường