16 điểm bởi xguru 2023-05-08 | 3 bình luận | Chia sẻ qua WhatsApp
  • Mô hình 15.5B được huấn luyện trên 1 nghìn tỷ token cho hơn 80 ngôn ngữ lập trình
  • Để tạo sinh hiệu quả, sử dụng MQA và có cửa sổ ngữ cảnh 8192 token
    • StarCoderBase: được huấn luyện trên bộ dữ liệu The-Stack v1.2 (6TB) với dữ liệu của hơn 80 ngôn ngữ
    • StarCoder: mô hình được huấn luyện thêm nhiều hơn cho Python
  • Cung cấp bản demo chat và tiện ích mở rộng cho VSCode

3 bình luận

 
ninebow 2023-05-08

Đây là liên kết tới bài báo trong bài đăng thông báo trên Twitter. :)

https://drive.google.com/file/d/1cN-b9GnWtHzQRoE7M7gAEyivY0kl4BYs/view

 
ninebow 2023-05-08

Hình như cũng đã được phát hành để có thể dùng ngay trong HuggingFace Chat. :)
https://huggingface.co/chat/?model=bigcode/starcoder