- Mô hình AI mã nguồn mở thương mại cỡ nhỏ được tối ưu cho tiếng Hàn và văn hóa Hàn Quốc
- Gồm ba kích thước tham số 3B, 1.5B, 0.5B, có thể tùy biến áp dụng cho nhiều ngành và môi trường sử dụng khác nhau
- Mô hình 3B có năng lực hiểu hình ảnh và video, nên được tối ưu cho các ứng dụng đa phương thức
- 1.5B và 0.5B mạnh về hiểu và tạo nội dung dựa trên văn bản, đặc biệt cho thấy hiệu năng xử lý tiếng Hàn vượt trội hơn các mô hình cạnh tranh
- Có thể tải mô hình từ Hugging Face và nếu đáp ứng điều kiện thì cũng có thể tự do sử dụng cho mục đích thương mại
Gieo hạt cho hệ sinh thái AI: AI mã nguồn mở thương mại, HyperCLOVA X SEED
- HyperCLOVA X SEED là mô hình AI mã nguồn mở có thể dùng cho mục đích thương mại
- Là một phần trong nỗ lực xây dựng hệ sinh thái AI tối ưu cho tiếng Hàn và văn hóa Hàn Quốc
- Ra mắt với 3 kích thước mô hình (3B, 1.5B, 0.5B), có thể linh hoạt áp dụng cho nhiều môi trường khác nhau
HyperCLOVA X SEED 3B
- Mô hình được tối ưu cho hiểu hình ảnh (vision understanding)
- Có thể xử lý chính xác thông tin thị giác trong ngữ cảnh tiếng Hàn và văn hóa Hàn Quốc
- Ví dụ: hỗ trợ hỏi đáp phức hợp như xác định địa điểm trong video và đề xuất lịch trình du lịch
- Có thể ứng dụng đa dạng như hướng dẫn viên du lịch, hệ thống hỏi đáp dựa trên hình ảnh
- Kết quả benchmark chứng minh hiệu năng cao trong hiểu thị giác và văn bản dựa trên tiếng Hàn
HyperCLOVA X SEED 1.5B
- Mô hình tập trung vào văn bản với khả năng làm theo chỉ thị
- Có thể thực hiện các tác vụ tạo văn bản nâng cao như dịch, tóm tắt, chỉ thị định dạng
- Có khả năng dịch và xử lý không chỉ tiếng Hàn mà còn các ngôn ngữ chính như tiếng Anh, tiếng Nhật
- Cũng hỗ trợ các định dạng phản hồi cụ thể như JSON, giọng điệu thân mật
- Ghi nhận hiệu năng vượt trội hơn các mô hình cạnh tranh trên các benchmark tiếng Hàn chính (KMMLU, KoBEST, v.v.)
HyperCLOVA X SEED 0.5B
- Mô hình siêu nhỏ gọn, có thể đối thoại tiếng Hàn tự nhiên và trả lời kiến thức
- Phù hợp với môi trường hạn chế tài nguyên như di động, smart home, thiết bị đeo
- Ví dụ: cung cấp câu trả lời có cấu trúc cho các câu hỏi đời sống như tư vấn nội thất
- Đạt hiệu năng nổi bật so với cùng phân khúc trên các benchmark tiếng Hàn như KMMLU, KoBEST
- Đạt hiệu quả cao với chi phí huấn luyện thấp hơn 39 lần so với mô hình cạnh tranh
So sánh chi phí huấn luyện:
- HyperCLOVA X SEED 0.5B: thời gian GPU A100 4.358 giờ, chi phí $6,537
- QWEN2.5-0.5B: thời gian GPU A100 169.257 giờ, chi phí $253,886
Cách sử dụng HyperCLOVA X SEED
- Có thể tải mô hình từ Hugging Face
- Phần lớn mục đích sử dụng thương mại được cho phép tự do (trừ một số điều kiện cụ thể)
- Dự kiến cung cấp hạ tầng thử nghiệm cho doanh nghiệp và tổ chức sử dụng
- Naver sẽ hỗ trợ các doanh nghiệp tăng cường năng lực AI riêng như một đối tác đồng hành trong hành trình sovereign AI
5 bình luận
Hừm.......
Hóa ra khi tìm hiểu vì sao giấy phép lại chấm dứt nếu có kiện tụng bằng sáng chế, thì mới biết các đài truyền hình từng kiện Naver Clova mà haha
Đọc giấy phép thì thấy đúng là không phải mã nguồn mở thật. Chỉ là công khai ra thôi chứ...
https://opensource.org/osd
Tôi đã kiểm tra giấy phép thì thấy nó không đáp ứng các điều kiện OSD ở trên. Xin hãy bỏ mọi cách dùng cụm từ “mã nguồn mở” và sửa thành “nguồn được công khai” hoặc “có thể sử dụng mã nguồn” để diễn đạt cho chính xác.
https://opensource.org/ai/open-source-ai-definition
Gần đây cũng đã có định nghĩa về AI nguồn mở. Phần này tôi chưa thể xác minh chính xác, nhưng có vẻ việc có thể dùng thuật ngữ AI nguồn mở hay không sẽ được quyết định tùy theo mức độ phù hợp với định nghĩa đó.