- Hỗ trợ độ dài ngữ cảnh 128K, 8 ngôn ngữ và bổ sung mô hình 405B (8B, 70B, 405B)
- Mô hình AI instruction-tuned mã nguồn mở mà bất kỳ ai cũng có thể fine-tuning, tinh chỉnh và triển khai ở bất cứ đâu
- Mô hình 405B mới được công bố đạt mức gần tương đương hoặc vượt GPT-4o trong các benchmark như MMLU (tổng quát), Human Eval (lập trình), GSM8K (toán học)
- Mô hình AI đẳng cấp hàng đầu về tính linh hoạt và khả năng kiểm soát
- Giúp cộng đồng có thể tận dụng các workflow mới như tạo dữ liệu tổng hợp và chưng cất mô hình
- Được huấn luyện với hơn 15 nghìn tỷ token và sử dụng hơn 16.000 GPU H100
- Mô hình 70B được nâng cấp vượt xa GPT-3.5 Turbo trong phần lớn các benchmark
3 bình luận
Wow, không biết phải cấu hình GPU thế nào mới có thể chạy được bản 405B nhỉ.
Có vẻ như bản 405B không dành cho mục đích fine-tuning trực tiếp hoặc serving. Nhìn vào việc CEO đã nhiều lần nhắc đến distillation, có lẽ đây là mô hình teacher dùng cho fine-tuning nhằm nâng cao chất lượng của các mô hình nhẹ hơn.
Ý kiến Hacker News
Các mô hình Llama 3.1 đã được cải thiện hiệu năng
So sánh GPT-4o và mô hình Llama 3.1 405B
Có thể trò chuyện với các mô hình mới trên Groq.com với độ trễ cực thấp
Nếu dùng phần cứng phù hợp, bạn có thể chạy một LLM cạnh tranh với GPT-4o ngay tại nhà
Có thể chạy mô hình cục bộ qua Ollama, Huggingface, Groq, v.v.
Kết quả chạy bản 70B trên Ollama là rất tốt
Claude 3.5 Sonnet rất tốt cho công việc lập trình
Hỏi về thông tin giá của các mô hình mã nguồn mở