Ghi chú về Mistral AI Now Summit
(koenvangilst.nl)- Mistral đang định vị mình không chỉ là một công ty mô hình, mà là doanh nghiệp AI full-stack bao gồm hạ tầng tính toán, mô hình, nền tảng và tư vấn
- Với trung tâm dữ liệu 40MW tại Paris cùng kế hoạch mở thêm trung tâm dữ liệu, công ty tạo khác biệt bằng các mô hình mở, tùy biến, có thể do khách hàng sở hữu và chạy on-premises
- Trọng tâm không nằm ở việc công bố mô hình mới mà là quan hệ đối tác; các hợp tác với ASML, BNP Paribas, Amazon Alexa+ và việc ra mắt Vibe for Work là điểm nhấn chính
- Trong hệ thống agent, harness bổ sung ngữ cảnh, tính liên tục và khả năng học hỏi; còn suy luận được xem là yếu tố cốt lõi để phục hồi lỗi và duy trì tính minh bạch
- Các mô hình nhỏ, chuyên biệt và triển khai on-premises là chiến lược phù hợp với các ngành bị quản lý chặt và doanh nghiệp châu Âu, tập trung vào ROI thực tế hơn là cuộc đua AGI
Định vị của Mistral
- Mistral đang chuyển hướng sang xây dựng một AI stack hoàn chỉnh gồm hạ tầng tính toán, mô hình, nền tảng và tư vấn, thay vì chỉ dừng ở một công ty mô hình
- Công ty đang sở hữu trung tâm dữ liệu 40MW tại Paris và cũng có kế hoạch xây thêm các trung tâm dữ liệu khác, bao gồm ở Thụy Điển
- Điểm khác biệt so với Anthropic hay OpenAI là các mô hình hiệu quả, mở và tùy biến có thể do khách hàng sở hữu và chạy on-premises
- Thông điệp của sự kiện đặt trọng tâm vào quan hệ đối tác nhiều hơn là mô hình mới hay đột phá kỹ thuật
- Hợp tác với ASML, BNP Paribas, Amazon Alexa+ được giới thiệu như những ví dụ giải quyết vấn đề thực tế bằng AI
- Vibe for Work đã được công bố và được giới thiệu là sản phẩm tương tự Claude for Work
Chiến lược sản phẩm và các trường hợp ứng dụng
-
Hệ thống agent và harness
- Chỉ mô hình thôi là chưa đủ; harness đóng vai trò bổ sung ngữ cảnh, tính liên tục và khả năng học hỏi
- Suy luận (reasoning) được xem là yếu tố cốt lõi giúp hệ thống quay lại, phục hồi từ lỗi và duy trì tính minh bạch
- Các thực tiễn tốt nhất của tổ chức được ghi lại thành skills và tiếp tục phát triển trong quá trình làm việc cùng AI agent
-
Mô hình nhỏ và chuyên biệt
- Mistral đưa ra các ví dụ cho thấy những mô hình nhỏ, nhanh và tập trung rõ ràng có thể vượt mô hình lớn đa dụng về hiệu quả năng lượng và tốc độ
- Document AI là mô hình dành cho OCR, được EU Patent Office sử dụng cho OCR quy mô lớn
- Voxtral là mô hình giọng nói đa ngôn ngữ, được dùng để vận hành Amazon Alexa+ tại châu Âu
- Robostral được dùng cho robotics công nghiệp cùng ASML
- Trong các ứng dụng agent sử dụng nhiều token, tốc độ và hiệu quả cũng quan trọng ngang với hiệu năng thô
-
Chủ quyền và triển khai on-premises
- BNP Paribas chạy mô hình Mistral on-premises tại Bỉ cho mục đích KYC, giữ dữ liệu nhạy cảm bên trong ngân hàng
- Abanca sử dụng agent orchestration để xử lý thông tin nhạy cảm của hơn 1 triệu khách hàng trong ứng dụng ở quy mô lớn
- Với các doanh nghiệp châu Âu trong ngành bị quản lý chặt, đây có thể là lựa chọn thay thế giúp giảm phụ thuộc vào các hyperscaler Mỹ
-
Ứng dụng trong nhân văn học
- Nhóm nghiên cứu tại Austrian Academy of Sciences đã fine-tune coding LLM Codestral của Mistral để đọc các mảnh papyrus hàng nghìn năm tuổi
- Công việc này góp phần giúp tiếp cận được bộ sưu tập 180.000 tài liệu được phát hiện ở sa mạc Ai Cập
- Đây được giới thiệu là công việc sẽ mất hơn 2.000 năm nếu không có AI
- Dự án Apollo của Austrian Academy of Sciences là ví dụ cho thấy AI cũng có thể đóng góp cho lĩnh vực nhân văn
-
Chiến lược đối tác AI châu Âu
- Tầm nhìn của Mistral gần với việc trở thành đối tác AI full-stack của châu Âu mang lại ROI thực tế ngay bây giờ hơn là chiến thắng trong cuộc đua AGI
- Thành bại của chiến lược này sẽ phụ thuộc vào việc có thêm bao nhiêu doanh nghiệp châu Âu chấp nhận cách tiếp cận của Mistral
- Sự kết hợp giữa mô hình mở, triển khai on-premises và quan hệ đối tác doanh nghiệp có thể hấp dẫn với nhiều tổ chức lớn trong EU
- Thời kỳ mù quáng phụ thuộc vào các tập đoàn công nghệ lớn của Mỹ đang dần khép lại, và điều quan trọng là một người chơi AI châu Âu nghiêm túc đã xuất hiện
Muốn tiếp tục nhận các chủ đề công nghệ được tuyển chọn?
Theo dõi kênh Telegram. @GeekNewsVN
1 bình luận
Ý kiến trên Hacker News
Tôi thực sự ủng hộ Mistral và các mô hình nhỏ chuyên biệt cho tác vụ, nhưng Mistral đã tụt lại quá xa kể từ sau quý 3 năm 2025
Muốn cạnh tranh lúc này thì ít nhất cũng phải chạy được mô hình suy luận tốt ở độ dài ngữ cảnh tầm trung, mà Mistral có vẻ không làm được điều đó
Hiện tại ở mảng mô hình nhỏ, Gemma4 và Qwen3.6 là tốt nhất, còn mô hình “small” của Mistral thì có 120B tham số, tức lớn hơn khoảng 4 lần, nhưng vẫn không cạnh tranh nổi với những mô hình chỉ bằng một phần tư kích thước
Một năm trước, vào thời Mistral Small 3.1, họ còn theo kịp, nhưng giờ thì gần như không còn hiện diện gì nữa
Nếu Mistral thật sự nghiêm túc nhắm vào thị trường on-premises và mô hình nhỏ chuyên biệt cho tác vụ, thì việc tạo ra một mô hình đủ khiến cộng đồng r/localLlama hào hứng có thể là một chỉ báo thay thế khá tốt
Việc họ gần như không nói gì về mô hình mới tại hội nghị cũng đáng lo. Cá nhân tôi nghĩ đó mới là phần họ nên tập trung nhất
Tôi tự hỏi rốt cuộc thứ gì đang cản trở họ. Là tiền, tài nguyên tính toán, năng lực, hay dữ liệu huấn luyện, tôi không biết
Muốn làm ra mô hình thực sự tốt thì có lẽ phải huấn luyện bằng những dữ liệu khá đáng ngờ như đầu ra từ các mô hình frontier, mà tôi sợ Mistral lại quá kiểu châu Âu và quá định hướng khách hàng doanh nghiệp nên không dám chấp nhận rủi ro đó
Cuối cùng có lẽ sẽ kết thúc như Dailymotion, thành một công ty zombie
Ví dụ tôi đang nghĩ đến một mô hình kiểu như tập con chuyên cho phần mềm của Opus, được dùng mặc định trong Claude Code
Nó sẽ nhỏ hơn, rẻ hơn để triển khai và sử dụng, và có thể còn nhanh hơn
Khi đó Mistral cần phải sẵn sàng, nhưng nhìn vào kết quả gần đây thì thực tế tôi không kỳ vọng nhiều
Mistral 4 có 6B tham số hoạt hóa trên mỗi token, nên dù có thể nhét 3~3.5 tham số mỗi token lên 4090 đi nữa, thì khoảng 240GB dung lượng tải về và lưu trữ cũng đã gần chạm giới hạn cho việc thử nghiệm cục bộ rồi
Nếu ở tình huống phải tải nhiều mô hình về để đánh giá thì lại càng vậy, và cũng khiến người khác khó làm các bản fine-tuning tiếp theo hơn, giống như với các mô hình Mistral/Magistral trước đây
Tôi đã nghe một bài nói chuyện từ một quản lý CNTT trong chính phủ rất giỏi, và ông ấy đang đánh giá các mô hình, nhưng rất không hài lòng với tình hình hiện tại
Ông ấy muốn dùng Mistral, và trong một số trường hợp đó còn là mô hình có trụ sở tại EU duy nhất có thể dùng, nhưng cũng biết rằng hiệu năng của nó thực sự kém và ngày càng tụt hậu
Có lẽ Mistral vẫn có thể xây dựng một mảng kinh doanh sinh lời chỉ nhờ việc là mô hình duy nhất khả thi cho các nhu cầu trong EU, dù nó không tốt. Thật buồn và khó nhìn
Tôi thật sự muốn châu Âu tham gia vào phát triển và nghiên cứu AI, và cũng từng rất ủng hộ Mistral
Nhưng khoảng cách công nghệ đang tích tụ quá nhiều. Nếu không sửa được điều này, đó sẽ lại là một bằng chứng nữa cho thấy châu Âu không thể vận hành các công ty công nghệ lớn với kết quả tốt
Trên thực tế, gần như tất cả các phòng lab Trung Quốc đều đang làm tốt hơn rất nhiều. Không cần nói đến DeepSeek, ngay cả những thứ như MiMo 2.5 hay Minimax 2.7 cũng đâu phải do Mistral làm ra
Các mô hình phía Mistral thì либо yếu hơn, либо lớn hơn và chậm hơn, hoặc chỉ đơn giản là không có mixture-of-experts (MoE), nên không ổn
Châu Âu đã tự bắn vào chân mình bằng đạo luật này, được vội vã làm ra vào lúc cơn cuồng loạn đại chúng đang ở đỉnh điểm, và giờ thì không công ty tỉnh táo nào muốn xây thứ gì ở đó nữa
Startup AI ở Mỹ hay Trung Quốc có thể bắt đầu chỉ với một cậu bé và một chiếc máy tính, còn ở châu Âu thì cậu bé đó cần thêm mười hai luật sư
Việc Mistral mờ nhạt dần dù có xuất phát điểm sớm, các mô hình đầu tiên rất hứa hẹn và số vốn đã nhận được, có thể là kết quả của việc cố tuân thủ toàn bộ đống quy định đó
Tôi rất ấn tượng với bản báo cáo kỹ thuật của nó. Tất nhiên tôi biết là bản thân ý tưởng MoE thì đã có từ trước
Nếu họ tiếp tục đẩy mạnh dòng Mixtral thì biết đâu bây giờ đã có được danh tiếng như họ Qwen hiện nay. Một cơ hội bị bỏ lỡ
So ra thì tôi thấy châu Âu vẫn đang làm khá ổn
BNP Paribas đang chạy mô hình Mistral on-premise tại Bỉ để phục vụ KYC, và điểm quan trọng là dữ liệu nhạy cảm được giữ lại داخل nội bộ ngân hàng
Abanca cũng đang dùng điều phối tác nhân để xử lý thông tin khách hàng nhạy cảm quy mô lớn, như 2 triệu khách hàng trên ứng dụng của họ
Với các công ty châu Âu trong những ngành bị quản lý chặt, đây là một lựa chọn thay thế tốt hơn so với phụ thuộc vào các hyperscaler của Mỹ, và việc Mistral tập trung vào mô hình on-premise và lưu trữ tại châu Âu là một hướng đi rất khôn ngoan
Ai cũng đang làm kỹ thuật triển khai trực diện hoặc kỹ thuật tùy biến cho khách hàng, vì nếu không thì họ chỉ trông như một công ty cộng biên lợi nhuận lên chi phí token
Rồi các công ty Neo-SaaS sẽ lấy hết tiền. Ngoài ra thì còn ai sẽ mua AI của Mistral, và họ còn lựa chọn nào khác nữa
Thay vào đó, họ dường như tập trung vào các mảng khác như mô hình đa ngôn ngữ, OCR và giọng nói
Trang giới thiệu mô hình của họ cũng cho thấy điều đó, nhưng nó quá nhiều màu sắc và có quá nhiều danh mục lẫn tên mô hình nên lúc nào tôi cũng thấy rối
Hy vọng các quyết định của họ sẽ mang lại kết quả tốt
Với startup châu Âu, B2B doanh nghiệp lúc nào cũng khiến tôi có cảm giác như là nơi để đi chết
Tôi đã tham dự sự kiện, quy mô người tham dự rất ấn tượng và lãnh đạo từ các công ty niêm yết lớn của châu Âu đều có mặt
Việc có nhiều đối tác được mời cũng rất thú vị. Từ Microsoft, Accenture, EY cho tới các startup như alpic.ai hay lingo.dev đều có
Có vẻ họ cũng đang đẩy mạnh hoạt động M&A
Bỏ qua chuyện kinh doanh thì thiết kế website thực sự rất xuất sắc: https://mistral.ai/
Tôi nhận được email từ Mistral nói rằng họ sẽ dần ngừng một số, có lẽ là phần lớn, các mô hình chuyên dụng như devstral vào tháng 8 và giờ bảo dùng mô hình đa dụng
Chi phí tăng theo cấp số nhân
Họ nói khuyến nghị chuyển từ Devstral 2(devstral-2512 và devstral-latest) sang mô hình mạnh hơn là Mistral Medium 3.5(mistral-medium-3-5, đặt reasoning_effort thành "high"), với giá $1.5/$7.5 cho mỗi 1 triệu token đầu vào/đầu ra
Trước đây là $0.4/$2
Dù sao thì sau khi nhận email, tôi hy vọng đó là tín hiệu cho thấy trong vài tháng tới họ sẽ tung ra những mô hình mới và tốt hơn
Có vẻ hoàn toàn không có hào lũy cạnh tranh. Nó giống một công ty tư vấn phần mềm có trung tâm dữ liệu
Hơn nữa, bài viết còn nói nhiều khách hàng dùng các mô hình này theo kiểu on-premise, nên trung tâm dữ liệu cũng không hẳn là lợi thế
Có gì ngăn cản bất kỳ startup nào được chính phủ hỗ trợ đi fine-tune các mô hình mã nguồn mở nhỏ chứ
Tôi không khẳng định đó là sự thật, chỉ là có thể đưa ra giả định như vậy
Là một người châu Âu, tôi đồng ý gấp 100 lần
Trong số những bên chơi này, tôi thực sự thích định hướng và mức độ minh bạch của Mistral
Abanca nói họ dùng điều phối tác nhân để xử lý thông tin khách hàng nhạy cảm ở “quy mô khổng lồ” là 2 triệu khách hàng trên ứng dụng, nhưng tôi không biết có phải chuẩn quy mô khổng lồ của tôi bị lệch không
2 triệu người dùng thì dữ liệu chắc chỉ cỡ vài trăm MB? Kể cả mỗi người dùng có nhiều dữ liệu thì có lẽ cũng chỉ vài GB
Theo những gì tôi hiểu từ bài trình bày, họ có vẻ đã dùng các tác nhân với phạm vi trách nhiệm hạn chế và có lẽ là các mô hình nhỏ hơn, để câu trả lời nhanh, ổn định và chi phí không quá lớn
Ngược lại, những mô hình kinh doanh như vậy có thể có khả năng phòng thủ khá tốt, nhưng thường cũng không dẫn tới mức lợi nhuận cao tương ứng