- Mô hình chỉ dành cho văn bản, được tối ưu cho Apple Silicon MLX và lượng tử hóa 4-bit dựa trên Gemma 4 26B IT, dung lượng khoảng 13GB
- Thông minh hơn bản gốc, nhanh hơn trên cùng một máy, đồng thời là mô hình không kiểm duyệt ổn định cho code, sử dụng công cụ và tiếng Hàn
- Là mẫu đầu bảng chỉ dành cho văn bản, tập trung vào xử lý văn bản nhanh thay vì đa phương thức
- QuickBench cải thiện lên 95.8 điểm (bản gốc 91.4) và tốc độ sinh nhanh hơn 8.7% (46.2 tok/s), độ trễ chờ phản hồi giảm rõ rệt khi sử dụng thực tế
- Vẫn giữ đặc tính không kiểm duyệt (uncensored) là thuộc tính cốt lõi, đồng thời cho đầu ra ổn định ở code, sử dụng công cụ và prompt tiếng Hàn
- Điểm tạo mã 98.6 (+6.3), cho kết quả chính xác hơn nhiều so với bản gốc khi viết hoặc refactor hàm Python cục bộ
- Điểm prompt tiếng Hàn 95.0 (+4.3), có thể dùng ngay mà không bị lỗi khi đặt câu hỏi bằng tiếng Hàn
- Hiệu năng xử lý tiếng Hàn và prompt kiểu agent tốt hơn bản gốc
- Vì là mô hình không kiểm duyệt nên không có câu trả lời nào bị chặn bởi bộ lọc nội dung, nhưng đầu ra vẫn không bị bất ổn hay hỏng
- Có thể đưa thẳng vào workload/pipeline agent cục bộ như tự động hóa trình duyệt, gọi công cụ, lập kế hoạch
- Cách chạy:
mlx_lm.server --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 --port 8080
- Tự động hỗ trợ phục vụ tương thích OpenAI, không cần cấu hình template riêng (thậm chí nếu đưa đường dẫn vào
--chat-template thì phản hồi có thể bị hỏng)
- MLX 4-bit, tensor BF16·U32, định dạng Safetensors
7 bình luận
Tôi đang dùng bản Heretic 31B trên Hugging Face, chắc cũng phải thử cái này thôi.
Tôi cũng պետք է thử một lần mới được.
Cảm ơn vì thông tin hữu ích.
Cái này có vẻ khác giấy phép với gemma4 bản gốc nhỉ
Đúng vậy, không phải Apache 2.0.
Trong tab giấy phép có liên kết tới Gemma 4, vậy có thể kiểm tra ở đâu?
Cũng có trên Ollama https://ollama.com/0xIbra/supergemma4-26b-uncensored-gguf-v2
Cả bản 31b lớn hơn một chút cũng có https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-mlx-4bit
https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-GGUF
Haha, thật thú vị vì đây là một mô hình do cộng đồng trong nước tạo ra.