Google công bố mã nguồn mở mô hình AI NLP Switch Transformer với 1,6 nghìn tỷ tham số

xguru · 2021-02-19T10:43:21+09:00

Cải thiện tốc độ huấn luyện lên 7x so với mô hình T5 (Text-to-Text Transfer Transformer) hiện có Sử dụng thuật toán MoE (Mixture-of-Experts) biến thể có tên Switch Routing, áp dụng các tham số khác nhau tùy theo từng giá trị đầu vào Sử dụng Mesh-Tensorflow để huấn luyện mô hình (Model Parallelism)

(infoq.com)

3 điểm bởi xguru 2021-02-19 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Cải thiện tốc độ huấn luyện lên 7x so với mô hình T5 (Text-to-Text Transfer Transformer) hiện có
Sử dụng thuật toán MoE (Mixture-of-Experts) biến thể có tên Switch Routing, áp dụng các tham số khác nhau tùy theo từng giá trị đầu vào
Sử dụng Mesh-Tensorflow để huấn luyện mô hình (Model Parallelism)

Google công bố mã nguồn mở mô hình AI NLP Switch Transformer với 1,6 nghìn tỷ tham số

Bài viết liên quan

Chưa có bình luận nào.