Meta AI công bố mô hình Code Llama 70B
(twitter.com/AIatMeta)- LLM hiệu năng cao dành cho sinh mã, được xây dựng bằng cách lấy mẫu thêm nhiều dữ liệu hơn từ Llama 2 với bộ dữ liệu chuyên biệt cho mã và huấn luyện trong thời gian dài hơn
- Đạt 67.8 trên HumanEval, cho thấy hiệu năng tốt nhất trong số các mô hình mở
- Tương tự giấy phép trước đó, có thể dùng cho cả mục đích nghiên cứu và thương mại
- 3 mô hình
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
- Hiện được cung cấp với 4 kích cỡ: 7B/13B/34B/70B
4 bình luận
Nếu có thể chạy cục bộ trên máy từ M2 Max trở lên thì có lẽ đây sẽ là món đồ chơi tuyệt nhất.
Nếu được lượng tử hóa thì có lẽ sẽ chạy khá ổn. Chỉ cần đợi thêm một chút là sẽ ra thôi nhỉ
Liên kết ở trên là liên kết để gửi yêu cầu truy cập tới Meta, nhưng trên Hugging Face thì đã công khai hết rồi
https://huggingface.co/codellama
Ý kiến trên Hacker News