- "Less Is More for Alignment"
- Mô hình LLaMA được fine-tune chỉ với 1.000 prompt được tuyển chọn kỹ lưỡng, không cần học tăng cường hay mô hình hóa sở thích
- Trong 43% trường hợp, được đánh giá ngang bằng hoặc được ưa thích hơn GPT-4; so với Bard là 58%, và cao hơn 65% so với DaVinci003 được huấn luyện bằng phản hồi từ con người
- Giả thuyết của bài báo là gần như toàn bộ tri thức của LLM được học trong giai đoạn pretraining, còn alignment là một quy trình đơn giản để học định dạng/phong cách tương tác với người dùng
- Bài báo mới của Meta AI
4 bình luận
Lẽ ra nên tiếp tục dự án Sejong và tích lũy dữ liệu mô hình ngôn ngữ tiếng Hàn dưới dạng mã nguồn mở. Thật sự là một dự án rất đáng tiếc...
Hiệu năng tiếng Anh đang cải thiện nhanh như vậy, nhưng thật tiếc là ngoài GPT ra thì phần lớn các mô hình vẫn chưa xử lý tốt tiếng Hàn...
Khả năng học tiếng Hàn của Anthropic Claude ở mức khá cao, nhưng khả năng diễn đạt ở một số điểm vẫn khác so với ChatGPT.
hu hu đúng vậy, ngoài GPT API ra thì tiếng Hàn tất cả đều ở mức rác...