- AI21 Labs đã ra mắt Jamba, mô hình AI cấp độ production đầu tiên trên thế giới dựa trên kiến trúc Mamba
- Jamba kết hợp thế mạnh của Mamba SSM (mô hình không gian trạng thái có cấu trúc) và kiến trúc transformer truyền thống để mang lại hiệu năng ấn tượng cùng cải thiện về hiệu quả
- Cửa sổ ngữ cảnh rộng tới 256K token. Có thể xử lý tối đa 140K token trên một GPU 80GB duy nhất
Kiến trúc lai và hiệu năng của Jamba
- Jamba sử dụng các lớp Mixture of Experts (MoE), trong đó chỉ 12B trong tổng số 52B tham số được dùng khi suy luận, thông qua kiến trúc lai SSM-transformer
- Có thể xử lý ngữ cảnh dài hơn nhiều so với các mô hình cạnh tranh như Llama 2 của Meta, đồng thời vẫn duy trì thông lượng và hiệu quả cao
- Cung cấp thông lượng cao hơn 3 lần trong ngữ cảnh dài, hiệu quả hơn các mô hình dựa trên transformer có kích thước tương đương
- Có cách tiếp cận theo block và layer; mỗi block của Jamba chứa một lớp attention hoặc Mamba, sau đó là perceptron đa tầng (MLP)
- Cấu trúc này sử dụng tỷ lệ một lớp transformer trên mỗi 8 lớp tổng thể
- Cho thấy kết quả nổi bật trên nhiều benchmark khác nhau, vượt qua hoặc ngang bằng các mô hình mới nhất cùng kích thước trên nhiều tác vụ
Giấy phép
- Jamba được phát hành dưới dạng open weights theo giấy phép Apache 2.0 và có sẵn trên Hugging Face
- Hiện tại Jamba được phát hành như một mô hình nghiên cứu, chưa có các cơ chế an toàn cần thiết cho sử dụng thương mại, nhưng AI21 Labs dự định sẽ phát hành một phiên bản an toàn hơn trong vài tuần tới
1 bình luận
Ý kiến trên Hacker News