- Phiên bản chuyên biệt cho tiếng Hàn của mô hình GPT-3 do Kakao Brain tạo ra
→ Được xây dựng dựa trên 6 tỷ tham số và 200 tỷ token dữ liệu tiếng Hàn
-
Thực hiện mọi loại tác vụ ngôn ngữ như xác định câu cho sẵn là tích cực hay tiêu cực, tóm tắt một dòng cho văn bản dài, suy luận câu để dự đoán kết luận, hiểu ngữ cảnh câu hỏi và đưa ra câu trả lời
-
Bắt đầu với tiếng Hàn, dự kiến sẽ mã nguồn mở các mô hình tiếng Anh, tiếng Nhật, tiếng Việt và tiếng Malaysia
-
Mở dưới dạng mã nguồn mở để đảm bảo khả năng tiếp cận, hướng tới đóng góp cho sự phát triển công nghệ IT trong nước và thúc đẩy nghiên cứu
3 bình luận
Trang demo: https://huggingface.co/spaces/akhaliq/kogpt
Tôi đã nhập nguyên văn câu sau vốn có sẵn ở đây làm mẫu, thì phải mất khoảng 2 phút cả thời gian chờ trong hàng đợi mới ra kết quả như thế này. Có vẻ thời gian thực sự dùng để xử lý là khoảng 16,9 giây.
input:
“Thông qua 'trí tuệ' suy nghĩ và hành động như con người, điều mà nhân loại cho đến nay vẫn chưa thể giải quyết được”
output:
“Thông qua 'trí tuệ' suy nghĩ và hành động như con người, đã đến thời đại phải trả lời vô số câu hỏi mà nhân loại cho đến nay vẫn chưa thể giải quyết. c Pixabay Khi nhân loại chúng ta đã đi qua hàng chục nghìn năm, điều quan trọng nhất phải giải quyết để sống một cuộc đời đúng nghĩa con người”
Tuyệt thật
GPT-J-6B, Cedille, KoGPT đều là các mô hình có 6 tỷ (6B) tham số.
GPT-3 giờ không còn là cái tên duy nhất trên thị trường https://vi.news.hada.io/topic?id=5349
GPT-Neo: dự án tạo mô hình quy mô GPT-3 dưới dạng mã nguồn mở/miễn phí https://vi.news.hada.io/topic?id=3599
Cedille - công bố mã nguồn mở mô hình tiếng Pháp quy mô 6B https://vi.news.hada.io/topic?id=5372