1 điểm bởi recast7838 3 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp

Startup AI Trung Quốc MiniMax đã chính thức ra mắt mô hình ngôn ngữ lớn đa phương thức 'M3' dựa trên open weights, vượt GPT-5.5 và Gemini 3.1 Pro với mức chi phí đột phá chỉ bằng 5~10% so với các mô hình thương mại hiện có của Mỹ.


Bản dịch đầy đủ

Startup AI Trung Quốc MiniMax đã chính thức ra mắt mô hình ngôn ngữ lớn đa phương thức 'M3' với hiệu năng lập trình cấp frontier và cửa sổ ngữ cảnh 1 triệu token, tạo ra làn sóng lớn trên thị trường AI doanh nghiệp toàn cầu. M3 dự kiến sẽ được phân phối trong vòng 10 ngày tới qua Hugging Face và GitHub theo giấy phép mã nguồn mở 'Open Weights', cho phép doanh nghiệp tải về cục bộ trên máy chủ nội bộ và thực hiện tối ưu hóa tùy chỉnh. Hiện tại, mô hình được cung cấp với giá ra mắt đặc biệt là 0.3 USD cho mỗi 1 triệu token đầu vào và 1.20 USD cho token đầu ra (tổng chi phí 1.50 USD {b:4}), và ngay cả khi áp dụng mức giá thông thường thì cũng chỉ ở mức 8~20% {p:14} chi phí của các mô hình thương mại lớn của Mỹ, qua đó áp đảo Google, OpenAI, Anthropic và các đại gia công nghệ Mỹ khác về mặt chi phí.

Bí quyết cốt lõi giúp M3 đạt được mức cắt giảm chi phí ấn tượng này là nhờ kiến trúc 'MiniMax Sparse Attention (MSA)', vốn giải quyết vấn đề bùng nổ chi phí tính toán tăng theo cấp số nhân của Transformer truyền thống. Công nghệ MSA chia dữ liệu thành các khối có độ chính xác cao và chỉ ghép động các truy vấn cần thiết, từ đó tối đa hóa hiệu quả phần cứng; khi xử lý 1 triệu token, nó hạ nhu cầu tính toán xuống còn khoảng 1/20 {p:5} so với trước đây và tăng tốc độ giải mã lên tới 15 lần. Dựa trên đổi mới mang tính cấu trúc này, M3 đạt 59.0% {p:59} trên SWE-Bench Pro, thước đo năng lực thực hiện kỹ thuật phần mềm tự động, qua đó vượt các mô hình đóng như GPT-5.5 và Gemini 3.1 Pro; đồng thời trên năng lực duyệt web và truy xuất thông tin (BrowseComp 83.5% {p:84}), mô hình này cũng vượt qua kỷ lục trước đó của Claude Ops 4.7.

So với Claude Ops 4.8, mô hình đóng hiệu năng cao nhất mới ra mắt gần đây (SWE-Bench Pro 69.2% {b:59,69}), vẫn còn một phần chênh lệch hiệu năng ở các bài toán suy luận siêu khó, nhưng M3 mang lại một mốc tham chiếu tự động hóa cục bộ mạnh mẽ mà không cần phí thuê bao API khổng lồ. Ngoài ra, MiniMax cũng đồng thời giới thiệu dòng tác nhân 'MiniMax Code' tích hợp M3, có khả năng tự viết mã, tự vận hành vòng lặp xác minh độc lập và tự sửa đổi, cùng với chính sách giá rất quyết liệt bắt đầu từ 20 USD/tháng (Plus). Trong môi trường doanh nghiệp nơi quyền riêng tư dữ liệu nghiêm ngặt và tuân thủ quy định là bắt buộc, việc cung cấp open weights cho M3 được kỳ vọng sẽ chặn tận gốc rủi ro rò rỉ dữ liệu lên đám mây và mang lại hiệu quả chi phí vượt trội để doanh nghiệp nội tại hóa các tài sản cốt lõi riêng của mình.

Một dòng của tác giả

Có lẽ tôi sẽ thử dùng nó trên đám mây ollama

2 bình luận

 

Tiêu chuẩn để nói là ngang tầm với các mô hình đó có lẽ đúng là hơi cường điệu thật, nhưng mức giá thì quá gây sốc.

 
recast7838 3 giờ trước

Tôi đang dùng ngay lúc này và không gặp vấn đề đang viết thì tiếng Trung tự nhiên xen vào như các mô hình Trung Quốc khác, có vẻ khả năng gọi tool cũng khá tốt.