- Sau khi LLaMA 2 ra mắt, sức nóng càng tăng lên
- Gần như mọi nhóm mô hình mã nguồn mở đều cập nhật mô hình của mình lên mô hình nền tảng mới
- WizardLM, Airoboros, Hermes, v.v.
- Mô hình mạnh nhất hiện nay là Stable Beluga 2 của StabilityAI
- Tinh chỉnh mô hình Llama2 70B với bộ dữ liệu theo phong cách Orca
- Có thể so sánh với ChatGPT
- Các mô hình ngữ cảnh dài
- LLaMA 7B 16K, LLaMA 13B 16K, LLaMA 7B 32K
- Các mô hình nhỏ nhưng mạnh
- Các mô hình 3B tham số mạnh ngang mức 7B
- Vẫn chưa chạm tới giới hạn và còn rất nhiều điều cần tiến xa hơn
- SlimPajama, SwiGLU, ALiBI, Variable Sequence Length, Maximal update parameterization (muP)
- Mô hình mở đánh bại ChatGPT trên MMLU: llama-2-70b-guanaco-qlora
- Chat nhiều lượt: llama2-13b-orca-8k-3319
- Các mô hình Trung Quốc đang cạnh tranh khốc liệt: CodeGeex2
- Mô hình mở đã đạt đến cấp độ ChatGPT chưa?
- Chưa, nhưng có thể sẽ sớm đạt tới
3 bình luận
Có lẽ sẽ ngày càng có nhiều trăn trở về việc phải kiếm tiền như thế nào từ vai trò của mỗi bên, tức bài toán monetization.
Bây giờ có quá nhiều dịch vụ AI này nọ nên tôi bị rối khi chọn, nào là dịch vụ AI đa dụng, rồi cả những dịch vụ AI được tối ưu riêng cho lập trình viên nữa~
Mong là các mô hình tiếng Hàn cũng sẽ phát triển hơn nữa.