Google tuyên bố Gemma 3 là mô hình AI mạnh nhất có thể chạy trên một GPU đơn

(theverge.com)

2 điểm bởi GN⁺ 2025-03-23 | 1 bình luận | Chia sẻ qua WhatsApp

Google đã công bố Gemma 3, phiên bản kế nhiệm của mô hình AI Gemma dựa trên công nghệ Gemini AI
Gemma 3 được thiết kế để giúp các nhà phát triển chạy ứng dụng AI trên nhiều nền tảng khác nhau
- Có thể chạy từ điện thoại thông minh đến máy trạm
- Hỗ trợ hơn 35 ngôn ngữ
- Có thể phân tích văn bản, hình ảnh và video ngắn
Google tuyên bố Gemma 3 là "mô hình đơn gia tốc vượt trội nhất thế giới"
- Mang lại hiệu năng tốt hơn trên một GPU đơn so với các mô hình của Facebook Llama, DeepSeek và OpenAI
- Cho hiệu năng được tối ưu hóa trên GPU Nvidia và phần cứng AI chuyên dụng
- Bộ mã hóa thị giác (vision encoder) được cải thiện
  - Hỗ trợ hình ảnh độ phân giải cao và không vuông
- Bao gồm bộ phân loại an toàn hình ảnh ShieldGemma 2 mới
  - Lọc nội dung khiêu dâm lộ liễu, nội dung nguy hiểm hoặc bạo lực
Gemma 3 vươn lên nhóm đầu trong bảng xếp hạng điểm ELO của Chatbot Arena
- Ghi nhận hiệu năng cao trên một GPU Nvidia H100 đơn
Tranh cãi về định nghĩa "mở" hoặc "mã nguồn mở" của các mô hình Gemma vẫn tiếp diễn
- Giấy phép của Google có các hạn chế sử dụng và không có thay đổi nào trong lần công bố này

1 bình luận

GN⁺ 2025-03-23

Ý kiến Hacker News

Một số mô hình AI có thể cầu nguyện. Khi được xin lời khuyên theo Kinh Thánh, nó nói rằng sẽ cầu nguyện giúp
Tò mò không biết một mô hình nhỏ đến mức nào thì vẫn có thể "thông minh nói chung". Có vẻ sẽ tồn tại một kích thước quá nhỏ để chứa mọi thông tin
- Tò mò không biết đến bao giờ sẽ có các mô hình nhỏ chuyên biệt cho từng lĩnh vực. Ví dụ, khi cần hỗ trợ lập trình thì có lẽ không cần biết đạo diễn của "Jaws" là ai
- Có lẽ trong tương lai sẽ có rất nhiều mô hình nhỏ, chuyên biệt
- Hoặc năng lực tính toán sẽ tăng lên để có thể chạy các mô hình đầy đủ chức năng trên desktop hay điện thoại
Llama 3.3 70B có thể không được xem là chạy trên "một GPU", nhưng chạy tốt trên một máy Mac
- Tốt hơn Gemma 3 rất nhiều trong việc giữ vững khái niệm qua các cuộc trò chuyện dài
Gemma 3 viết lách tốt hơn Gemma 2 rất nhiều
- Cải tiến lớn là có thể thực sự dùng được cửa sổ ngữ cảnh 32k+ và nó không biến thành rác ngẫu nhiên
Điều này chỉ giữ được một tuần sau khi Mistral phát hành 3.1 Small. Tốc độ phát triển của AI thật nhanh
Mistral Small 3.1 được phát hành sau Gemma 3 và tốt hơn nhiều
- Ít từ chối hơn, chính xác hơn, bớt lan man hơn, và đặc biệt tốt hơn trong lập trình
Về mặt kỹ thuật, DeepSeek R1 với bản lượng tử hóa 1.58-bit Unsloth chạy được trên một GPU duy nhất và 128GB RAM hệ thống
- Hiệu năng rất ấn tượng, nhưng tốt hơn là không nên vội
Bài đăng của Google tuần trước: [liên kết]
Tò mò không biết có ai đang dùng GoogleAI không
- Công ty AI có CEO là AI thì dùng dịch ngôn ngữ AI, nhưng tất cả các sản phẩm GPT thực tế đều tệ và có tiếng xấu
- Ai lại muốn gửi các cuộc trò chuyện riêng tư của mình cho Google để bị giám sát chứ?
Tò mò không biết nó có chạy được trên phần cứng đã bị cắt giảm hay không

Google tuyên bố Gemma 3 là mô hình AI mạnh nhất có thể chạy trên một GPU đơn

Bài viết liên quan

1 bình luận

Ý kiến Hacker News