MosaicML công bố mô hình MPT-7B-8K

xguru · 2023-07-21T10:02:02+09:00

LLM mã nguồn mở 7B tham số hỗ trợ độ dài ngữ cảnh 8k Ngoài MPT-7B, mô hình được huấn luyện thêm trong 3 ngày trên 256 GPU NVidia H100 với 500B token dữ liệu Công bố 3 mô hình: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat Có thể sử dụng cho mục đích thương mại Hỗ trợ đầu vào 8k bằng ALiBi (Attention with Linear Biases Enables Input Length Extrapolation) Huấn luyện và suy luận nhanh nhờ FlashAttention và FasterTrasformer

(mosaicml.com)

9 điểm bởi xguru 2023-07-21 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

LLM mã nguồn mở 7B tham số hỗ trợ độ dài ngữ cảnh 8k
Ngoài MPT-7B, mô hình được huấn luyện thêm trong 3 ngày trên 256 GPU NVidia H100 với 500B token dữ liệu
Công bố 3 mô hình: MPT-7B-8k, MPT-7B-8k-Instruct, MPT-7B-8k-Chat
Có thể sử dụng cho mục đích thương mại
Hỗ trợ đầu vào 8k bằng ALiBi (Attention with Linear Biases Enables Input Length Extrapolation)
Huấn luyện và suy luận nhanh nhờ FlashAttention và FasterTrasformer

MosaicML công bố mô hình MPT-7B-8K

Bài viết liên quan

Chưa có bình luận nào.