Yi - LLM song ngữ mã nguồn mở thế hệ mới
(github.com/01-ai)- Mô hình ngôn ngữ lớn mã nguồn mở thế hệ mới được huấn luyện từ đầu bởi các nhà phát triển
- Được định hướng là mô hình song ngữ và được huấn luyện trên kho ngữ liệu đa ngôn ngữ 3T, cho thấy hiệu năng mạnh mẽ trong hiểu ngôn ngữ, suy luận thường thức, khả năng đọc hiểu, v.v.
- Dựa trên các mô hình ngôn ngữ tiền huấn luyện 6B và 34B, sau đó mở rộng thành mô hình chatbot, mô hình ngữ cảnh dài 200K, mô hình mở rộng độ sâu và mô hình thị giác-ngôn ngữ
- Mô hình Yi-34B-Chat
- Đứng thứ 2 trên bảng xếp hạng AlpacaEval sau GPT-4 Turbo, vượt qua các LLM khác
- Vượt qua các mô hình mã nguồn mở hiện có ở cả tiếng Anh lẫn tiếng Trung, đồng thời đứng đầu nhiều benchmark
- Dù áp dụng cùng kiến trúc mô hình với Llama, đây không phải là mô hình phái sinh từ Llama. Không sử dụng trọng số của Llama
- Được cung cấp với nhiều kích cỡ khác nhau và có thể tinh chỉnh mô hình để phù hợp với các yêu cầu cụ thể
- Mô hình chat
- Yi-34B-Chat, Yi-34B-Chat-4bits, Yi-34B-Chat-8bits
- Yi-6B-Chat, Yi-6B-Chat-4bits, Yi-6B-Chat-8bits
- Mô hình base
- Yi-34B, Yi-34B-200K
- Yi-9B
- Yi-6B, Yi-6B-200K
- Mô hình chat
1 bình luận
Ý kiến trên Hacker News