MiniMax-M3 ra mắt, vượt GPT-5.5 và Gemini 3.1 Pro trên các benchmark chủ chốt với chi phí chỉ bằng 5–10%

(venturebeat.com)

12 điểm bởi recast7838 2026-06-02 | 6 bình luận | Chia sẻ qua WhatsApp

Startup AI Trung Quốc MiniMax đã chính thức ra mắt mô hình ngôn ngữ lớn đa phương thức 'M3' dựa trên open weights, vượt GPT-5.5 và Gemini 3.1 Pro với mức chi phí đột phá chỉ bằng 5~10% so với các mô hình thương mại hiện có của Mỹ.

Bản dịch đầy đủ

Startup AI Trung Quốc MiniMax đã chính thức ra mắt mô hình ngôn ngữ lớn đa phương thức 'M3' với hiệu năng lập trình cấp frontier và cửa sổ ngữ cảnh 1 triệu token, tạo ra làn sóng lớn trên thị trường AI doanh nghiệp toàn cầu. M3 dự kiến sẽ được phân phối trong vòng 10 ngày tới qua Hugging Face và GitHub theo giấy phép mã nguồn mở 'Open Weights', cho phép doanh nghiệp tải về cục bộ trên máy chủ nội bộ và thực hiện tối ưu hóa tùy chỉnh. Hiện tại, mô hình được cung cấp với giá ra mắt đặc biệt là 0.3 USD cho mỗi 1 triệu token đầu vào và 1.20 USD cho token đầu ra (tổng chi phí 1.50 USD {b:4}), và ngay cả khi áp dụng mức giá thông thường thì cũng chỉ ở mức 8~20% {p:14} chi phí của các mô hình thương mại lớn của Mỹ, qua đó áp đảo Google, OpenAI, Anthropic và các đại gia công nghệ Mỹ khác về mặt chi phí.

Bí quyết cốt lõi giúp M3 đạt được mức cắt giảm chi phí ấn tượng này là nhờ kiến trúc 'MiniMax Sparse Attention (MSA)', vốn giải quyết vấn đề bùng nổ chi phí tính toán tăng theo cấp số nhân của Transformer truyền thống. Công nghệ MSA chia dữ liệu thành các khối có độ chính xác cao và chỉ ghép động các truy vấn cần thiết, từ đó tối đa hóa hiệu quả phần cứng; khi xử lý 1 triệu token, nó hạ nhu cầu tính toán xuống còn khoảng 1/20 {p:5} so với trước đây và tăng tốc độ giải mã lên tới 15 lần. Dựa trên đổi mới mang tính cấu trúc này, M3 đạt 59.0% {p:59} trên SWE-Bench Pro, thước đo năng lực thực hiện kỹ thuật phần mềm tự động, qua đó vượt các mô hình đóng như GPT-5.5 và Gemini 3.1 Pro; đồng thời trên năng lực duyệt web và truy xuất thông tin (BrowseComp 83.5% {p:84}), mô hình này cũng vượt qua kỷ lục trước đó của Claude Ops 4.7.

So với Claude Ops 4.8, mô hình đóng hiệu năng cao nhất mới ra mắt gần đây (SWE-Bench Pro 69.2% {b:59,69}), vẫn còn một phần chênh lệch hiệu năng ở các bài toán suy luận siêu khó, nhưng M3 mang lại một mốc tham chiếu tự động hóa cục bộ mạnh mẽ mà không cần phí thuê bao API khổng lồ. Ngoài ra, MiniMax cũng đồng thời giới thiệu dòng tác nhân 'MiniMax Code' tích hợp M3, có khả năng tự viết mã, tự vận hành vòng lặp xác minh độc lập và tự sửa đổi, cùng với chính sách giá rất quyết liệt bắt đầu từ 20 USD/tháng (Plus). Trong môi trường doanh nghiệp nơi quyền riêng tư dữ liệu nghiêm ngặt và tuân thủ quy định là bắt buộc, việc cung cấp open weights cho M3 được kỳ vọng sẽ chặn tận gốc rủi ro rò rỉ dữ liệu lên đám mây và mang lại hiệu quả chi phí vượt trội để doanh nghiệp nội tại hóa các tài sản cốt lõi riêng của mình.

Một dòng của tác giả

Có lẽ tôi sẽ thử dùng nó trên đám mây ollama

6 bình luận

jimmy2056 29 ngày trước

Vì là mô hình của Trung Quốc nên dùng qua API thì hơi ngại, sẽ tốt hơn nếu có thể chạy cục bộ.

recast7838 2026-06-02

Tôi đang dùng ngay lúc này và không gặp vấn đề đang viết thì tiếng Trung tự nhiên xen vào như các mô hình Trung Quốc khác, có vẻ khả năng gọi tool cũng khá tốt.

somang04 24 ngày trước

Tôi đang dùng gói đăng ký của minimax, mà nếu 100 đô một năm thì.. có thể dùng cực kỳ dư dả. Thậm chí còn có thể tạo 100 bài nhạc mỗi ngày nữa. (Dù đôi khi cũng ra mấy bài kiểu country được làm bằng tiếng Trung một cách khá vô lý..)

Có vẻ như đây là một phiên bản nhỏ hơn của suno hoặc flow, và khá ổn để làm nhạc nền BGM.

Còn về mảng coding hay agent thì tôi chưa dùng thử. Chắc phải test và so sánh với API của gemini / open ai / anthropic mới được.

vndk2234 29 ngày trước

Không hiểu sao giá lại ra ở mức kiểu GPT nano...
Khi dùng AI, nếu không phải kiểu người tự tải cả chứng minh nhân dân của mình lên thì dùng đồ Trung Quốc chắc cũng không có vấn đề gì lớn

runableapp 29 ngày trước

Vì là mô hình của Trung Quốc nên tôi vẫn hơi ngại khi sử dụng, nhưng cũng khiến tôi nghĩ rằng nếu không có những dịch vụ Trung Quốc như thế này thì các công ty Mỹ đã tăng giá dịch vụ của họ lên đến mức nào rồi. Cũng khiến tôi nghi ngờ liệu có liên quan gì đến việc Trump đưa ra những chính sách như vậy hay không.

b8g6pn 2026-06-02

Tiêu chuẩn để nói là ngang tầm với các mô hình đó có lẽ đúng là hơi cường điệu thật, nhưng mức giá thì quá gây sốc.

MiniMax-M3 ra mắt, vượt GPT-5.5 và Gemini 3.1 Pro trên các benchmark chủ chốt với chi phí chỉ bằng 5–10%

Bản dịch đầy đủ

Một dòng của tác giả

Bài viết liên quan

6 bình luận