12 điểm bởi xguru 2021-11-20 | 3 bình luận | Chia sẻ qua WhatsApp
  • Phiên bản chuyên biệt cho tiếng Hàn của mô hình GPT-3 do Kakao Brain tạo ra

→ Được xây dựng dựa trên 6 tỷ tham số và 200 tỷ token dữ liệu tiếng Hàn

  • Thực hiện mọi loại tác vụ ngôn ngữ như xác định câu cho sẵn là tích cực hay tiêu cực, tóm tắt một dòng cho văn bản dài, suy luận câu để dự đoán kết luận, hiểu ngữ cảnh câu hỏi và đưa ra câu trả lời

  • Bắt đầu với tiếng Hàn, dự kiến sẽ mã nguồn mở các mô hình tiếng Anh, tiếng Nhật, tiếng Việt và tiếng Malaysia

  • Mở dưới dạng mã nguồn mở để đảm bảo khả năng tiếp cận, hướng tới đóng góp cho sự phát triển công nghệ IT trong nước và thúc đẩy nghiên cứu

3 bình luận

 
kunggom 2021-11-21

Trang demo: https://huggingface.co/spaces/akhaliq/kogpt

Tôi đã nhập nguyên văn câu sau vốn có sẵn ở đây làm mẫu, thì phải mất khoảng 2 phút cả thời gian chờ trong hàng đợi mới ra kết quả như thế này. Có vẻ thời gian thực sự dùng để xử lý là khoảng 16,9 giây.

input:

“Thông qua 'trí tuệ' suy nghĩ và hành động như con người, điều mà nhân loại cho đến nay vẫn chưa thể giải quyết được”

output:

“Thông qua 'trí tuệ' suy nghĩ và hành động như con người, đã đến thời đại phải trả lời vô số câu hỏi mà nhân loại cho đến nay vẫn chưa thể giải quyết. c Pixabay Khi nhân loại chúng ta đã đi qua hàng chục nghìn năm, điều quan trọng nhất phải giải quyết để sống một cuộc đời đúng nghĩa con người”

 
alstjr7375 2021-11-20

Tuyệt thật

 
xguru 2021-11-20

GPT-J-6B, Cedille, KoGPT đều là các mô hình có 6 tỷ (6B) tham số.