Alpaca: Mô hình Instruction-Following mã nguồn mở mạnh mẽ ở mức GPT-3.5

xguru · 2023-03-14T11:21:01+09:00

Stanford CRFM đã fine-tune LLaMA 7B của Meta bằng 52K dữ liệu Instruction-Following Hoạt động tương tự GPT-3.5 (text-davinci-003) của OpenAI, nhưng nhỏ hơn rất nhiều và chi phí rẻ hơn Công bố recipe huấn luyện và dữ liệu, và dự kiến sẽ phát hành cả trọng số mô hình sau này Chỉ công bố cho mục đích nghiên cứu, cấm sử dụng thương mại Việc fine-tune mất 3 giờ trên 8 GPU A100 80GB, và có thể thực hiện trên cloud với chi phí dưới khoảng 100 USD

(crfm.stanford.edu)

19 điểm bởi xguru 2023-03-14 | 1 bình luận | Chia sẻ qua WhatsApp

Stanford CRFM đã fine-tune LLaMA 7B của Meta bằng 52K dữ liệu Instruction-Following
Hoạt động tương tự GPT-3.5 (text-davinci-003) của OpenAI, nhưng nhỏ hơn rất nhiều và chi phí rẻ hơn
Công bố recipe huấn luyện và dữ liệu, và dự kiến sẽ phát hành cả trọng số mô hình sau này
Chỉ công bố cho mục đích nghiên cứu, cấm sử dụng thương mại
Việc fine-tune mất 3 giờ trên 8 GPU A100 80GB, và có thể thực hiện trên cloud với chi phí dưới khoảng 100 USD

1 bình luận

xguru 2023-03-14

Repo: https://github.com/tatsu-lab/stanford_alpaca
Bản demo web: https://crfm.stanford.edu/alpaca/

Việc công bố LLaMA đúng là đang tạo ra một khoảnh khắc Stable Diffusion. Mọi thứ đang thay đổi cực kỳ nhanh.

Alpaca: Mô hình Instruction-Following mã nguồn mở mạnh mẽ ở mức GPT-3.5

Bài viết liên quan

1 bình luận