- Mô hình ngôn ngữ lớn mã nguồn mở có thể dùng cho cả nghiên cứu và mục đích thương mại
- Được huấn luyện với 2 nghìn tỷ token dữ liệu, nhiều hơn 40% so với Llama 1
- Độ dài ngữ cảnh gấp đôi: 4096
- Ba kích thước mô hình: 7B, 13B, 70B
- Hiệu năng vượt trội hơn các mô hình ngôn ngữ mã nguồn mở khác trong nhiều benchmark như suy luận, lập trình, mức độ thành thạo và kiểm tra kiến thức (MPT, Falcon, Llama-1)
- Được huấn luyện bằng các nguồn dữ liệu công khai; bản fine-tune Llama-2-chat cũng sử dụng bộ instruction công khai và hơn một triệu chú thích do con người thực hiện
- Sử dụng Reinforcement Learning from Human Feedback (RLHF). Bao gồm Rejection Sampling và Proximal Policy Optimization (PPO)
- Những gì có trong bản tải xuống
- Model code
- Model Weights
- README (User Guide)
- Responsible Use Guide
- License
- Acceptable Use Policy
- Model Card
1 bình luận
Ý kiến trên Hacker News