OPT - Mô hình ngôn ngữ quy mô GPT-3 (175B) do Meta công bố

xguru · 2022-05-04T12:41:14+09:00

"Open Pre-trained Transformer Language Model" Các mô hình ngôn ngữ quy mô lớn như vậy đòi hỏi nguồn vốn đáng kể mới có thể xây dựng, và nếu chỉ công khai quyền truy cập API thì rất khó để nghiên cứu Dành cho các nhà nghiên cứu quan tâm, toàn bộ mô hình, mã dùng cho thí nghiệm và sổ nhật ký đều được công khai để có thể tải xuống So với GPT-3, chỉ cần 1/7 lượng khí thải carbon

(arxiv.org)

7 điểm bởi xguru 2022-05-04 | 1 bình luận | Chia sẻ qua WhatsApp

"Open Pre-trained Transformer Language Model"

Các mô hình ngôn ngữ quy mô lớn như vậy đòi hỏi nguồn vốn đáng kể mới có thể xây dựng, và nếu chỉ công khai quyền truy cập API thì rất khó để nghiên cứu
Dành cho các nhà nghiên cứu quan tâm, toàn bộ mô hình, mã dùng cho thí nghiệm và sổ nhật ký đều được công khai để có thể tải xuống
So với GPT-3, chỉ cần 1/7 lượng khí thải carbon

1 bình luận

xguru 2022-05-04

https://github.com/facebookresearch/metaseq

OPT - Mô hình ngôn ngữ quy mô GPT-3 (175B) do Meta công bố

Bài viết liên quan

1 bình luận