Hiện trạng của các mô hình ngôn ngữ mã nguồn mở

xguru · 2023-08-09T11:03:01+09:00

Sau khi LLaMA 2 ra mắt, sức nóng càng tăng lên Gần như mọi nhóm mô hình mã nguồn mở đều cập nhật mô hình của mình lên mô hình nền tảng mới WizardLM, Airoboros, Hermes, v.v. Mô hình mạnh nhất hiện nay là Stable Beluga 2 của StabilityAI Tinh chỉnh mô hình Llama2 70B với bộ dữ liệu theo phong cách Orca Có thể so sánh với ChatGPT Các mô hình ngữ cảnh dài LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K Các mô hình nhỏ nhưng mạnh Các mô hình 3B tham số mạnh ngang mức 7B Vẫn chưa chạm tới giới hạn và còn rất nhiều điều cần tiến xa hơn SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP) Mô hình mở đánh bại ChatGPT trên MMLU: llama-2-70b-guanaco-qlora Chat nhiều lượt: llama2-13b-orca-8k-3319 Các mô hình Trung Quốc đang cạnh tranh khốc liệt: CodeGeex2 Mô hình mở đã đạt đến cấp độ ChatGPT chưa? Chưa, nhưng có thể sẽ sớm đạt tới

(twitter.com/Yampeleg)

22 điểm bởi xguru 2023-08-09 | 3 bình luận | Chia sẻ qua WhatsApp

Sau khi LLaMA 2 ra mắt, sức nóng càng tăng lên
- Gần như mọi nhóm mô hình mã nguồn mở đều cập nhật mô hình của mình lên mô hình nền tảng mới
  - WizardLM, Airoboros, Hermes, v.v.
- Mô hình mạnh nhất hiện nay là Stable Beluga 2 của StabilityAI
  - Tinh chỉnh mô hình Llama2 70B với bộ dữ liệu theo phong cách Orca
  - Có thể so sánh với ChatGPT
Các mô hình ngữ cảnh dài
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
Quảng cáo
Các mô hình nhỏ nhưng mạnh
- Các mô hình 3B tham số mạnh ngang mức 7B
- Vẫn chưa chạm tới giới hạn và còn rất nhiều điều cần tiến xa hơn
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
Mô hình mở đánh bại ChatGPT trên MMLU: llama-2-70b-guanaco-qlora
Chat nhiều lượt: llama2-13b-orca-8k-3319
Các mô hình Trung Quốc đang cạnh tranh khốc liệt: CodeGeex2
Mô hình mở đã đạt đến cấp độ ChatGPT chưa?
- Chưa, nhưng có thể sẽ sớm đạt tới

3 bình luận

botplaysdice 2023-08-10

Có lẽ sẽ ngày càng có nhiều trăn trở về việc phải kiếm tiền như thế nào từ vai trò của mỗi bên, tức bài toán monetization.

geekbini 2023-08-09

Bây giờ có quá nhiều dịch vụ AI này nọ nên tôi bị rối khi chọn, nào là dịch vụ AI đa dụng, rồi cả những dịch vụ AI được tối ưu riêng cho lập trình viên nữa~

kuroneko 2023-08-09

Mong là các mô hình tiếng Hàn cũng sẽ phát triển hơn nữa.

Hiện trạng của các mô hình ngôn ngữ mã nguồn mở

Bài viết liên quan

3 bình luận