LLaMA - LLM 65 tỷ tham số do Meta công bố

xguru · 2023-02-28T10:49:01+09:00

Được công bố với 4 kích cỡ: 7B, 13B, 33B, 65B Dù có quy mô nhỏ hơn nhiều, nhờ tăng cường huấn luyện dữ liệu và tinh chỉnh nên đây là mô hình hiệu quả, có thể so sánh với các mô hình lớn hơn 33B/65B được huấn luyện với 1,4 nghìn tỷ token (7B là 1 nghìn tỷ) "Mô hình 13B vượt trội hơn GPT-3 175B, còn 65B có thể cạnh tranh với Chinchilla70B và PaLM-540B lớn hơn nhiều" Chỉ có thể sử dụng cho các mục đích phi thương mại như nghiên cứu AI (cần đăng ký và được phê duyệt)

(ai.facebook.com)

7 điểm bởi xguru 2023-02-28 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Được công bố với 4 kích cỡ: 7B, 13B, 33B, 65B
Dù có quy mô nhỏ hơn nhiều, nhờ tăng cường huấn luyện dữ liệu và tinh chỉnh nên đây là mô hình hiệu quả, có thể so sánh với các mô hình lớn hơn
33B/65B được huấn luyện với 1,4 nghìn tỷ token (7B là 1 nghìn tỷ)
"Mô hình 13B vượt trội hơn GPT-3 175B, còn 65B có thể cạnh tranh với Chinchilla70B và PaLM-540B lớn hơn nhiều"
Chỉ có thể sử dụng cho các mục đích phi thương mại như nghiên cứu AI (cần đăng ký và được phê duyệt)

LLaMA - LLM 65 tỷ tham số do Meta công bố

Bài viết liên quan

Chưa có bình luận nào.