LIMA - Đạt hiệu năng tiệm cận GPT-4 chỉ với mô hình LLaMA 65B và 1.000 prompt

xguru · 2023-05-23T09:36:28+09:00

"Less Is More for Alignment" Mô hình LLaMA được fine-tune chỉ với 1.000 prompt được tuyển chọn kỹ lưỡng, không cần học tăng cường hay mô hình hóa sở thích Trong 43% trường hợp, được đánh giá ngang bằng hoặc được ưa thích hơn GPT-4; so với Bard là 58%, và cao hơn 65% so với DaVinci003 được huấn luyện bằng phản hồi từ con người Giả thuyết của bài báo là gần như toàn bộ tri thức của LLM được học trong giai đoạn pretraining, còn alignment là một quy trình đơn giản để học định dạng/phong cách tương tác với người dùng Bài báo mới của Meta AI

(arxiv.org)

24 điểm bởi xguru 2023-05-23 | 4 bình luận | Chia sẻ qua WhatsApp

"Less Is More for Alignment"
Mô hình LLaMA được fine-tune chỉ với 1.000 prompt được tuyển chọn kỹ lưỡng, không cần học tăng cường hay mô hình hóa sở thích
Trong 43% trường hợp, được đánh giá ngang bằng hoặc được ưa thích hơn GPT-4; so với Bard là 58%, và cao hơn 65% so với DaVinci003 được huấn luyện bằng phản hồi từ con người
Giả thuyết của bài báo là gần như toàn bộ tri thức của LLM được học trong giai đoạn pretraining, còn alignment là một quy trình đơn giản để học định dạng/phong cách tương tác với người dùng
Bài báo mới của Meta AI

4 bình luận

merong 2023-05-23

Lẽ ra nên tiếp tục dự án Sejong và tích lũy dữ liệu mô hình ngôn ngữ tiếng Hàn dưới dạng mã nguồn mở. Thật sự là một dự án rất đáng tiếc...

kuroneko 2023-05-23

Hiệu năng tiếng Anh đang cải thiện nhanh như vậy, nhưng thật tiếc là ngoài GPT ra thì phần lớn các mô hình vẫn chưa xử lý tốt tiếng Hàn...

dulco 2023-05-23

Khả năng học tiếng Hàn của Anthropic Claude ở mức khá cao, nhưng khả năng diễn đạt ở một số điểm vẫn khác so với ChatGPT.

test4458 2023-05-23

hu hu đúng vậy, ngoài GPT API ra thì tiếng Hàn tất cả đều ở mức rác...

LIMA - Đạt hiệu năng tiệm cận GPT-4 chỉ với mô hình LLaMA 65B và 1.000 prompt

Bài viết liên quan

4 bình luận