1 điểm bởi GN⁺ 5 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Mistral đang định vị mình không chỉ là một công ty mô hình, mà là doanh nghiệp AI full-stack bao gồm hạ tầng tính toán, mô hình, nền tảng và tư vấn
  • Với trung tâm dữ liệu 40MW tại Paris cùng kế hoạch mở thêm trung tâm dữ liệu, công ty tạo khác biệt bằng các mô hình mở, tùy biến, có thể do khách hàng sở hữu và chạy on-premises
  • Trọng tâm không nằm ở việc công bố mô hình mới mà là quan hệ đối tác; các hợp tác với ASML, BNP Paribas, Amazon Alexa+ và việc ra mắt Vibe for Work là điểm nhấn chính
  • Trong hệ thống agent, harness bổ sung ngữ cảnh, tính liên tục và khả năng học hỏi; còn suy luận được xem là yếu tố cốt lõi để phục hồi lỗi và duy trì tính minh bạch
  • Các mô hình nhỏ, chuyên biệt và triển khai on-premises là chiến lược phù hợp với các ngành bị quản lý chặt và doanh nghiệp châu Âu, tập trung vào ROI thực tế hơn là cuộc đua AGI

Định vị của Mistral

  • Mistral đang chuyển hướng sang xây dựng một AI stack hoàn chỉnh gồm hạ tầng tính toán, mô hình, nền tảng và tư vấn, thay vì chỉ dừng ở một công ty mô hình
  • Công ty đang sở hữu trung tâm dữ liệu 40MW tại Paris và cũng có kế hoạch xây thêm các trung tâm dữ liệu khác, bao gồm ở Thụy Điển
  • Điểm khác biệt so với Anthropic hay OpenAI là các mô hình hiệu quả, mở và tùy biến có thể do khách hàng sở hữu và chạy on-premises
  • Thông điệp của sự kiện đặt trọng tâm vào quan hệ đối tác nhiều hơn là mô hình mới hay đột phá kỹ thuật
    • Hợp tác với ASML, BNP Paribas, Amazon Alexa+ được giới thiệu như những ví dụ giải quyết vấn đề thực tế bằng AI
    • Vibe for Work đã được công bố và được giới thiệu là sản phẩm tương tự Claude for Work

Chiến lược sản phẩm và các trường hợp ứng dụng

  • Hệ thống agent và harness

    • Chỉ mô hình thôi là chưa đủ; harness đóng vai trò bổ sung ngữ cảnh, tính liên tục và khả năng học hỏi
    • Suy luận (reasoning) được xem là yếu tố cốt lõi giúp hệ thống quay lại, phục hồi từ lỗi và duy trì tính minh bạch
    • Các thực tiễn tốt nhất của tổ chức được ghi lại thành skills và tiếp tục phát triển trong quá trình làm việc cùng AI agent
  • Mô hình nhỏ và chuyên biệt

    • Mistral đưa ra các ví dụ cho thấy những mô hình nhỏ, nhanh và tập trung rõ ràng có thể vượt mô hình lớn đa dụng về hiệu quả năng lượng và tốc độ
    • Document AI là mô hình dành cho OCR, được EU Patent Office sử dụng cho OCR quy mô lớn
    • Voxtral là mô hình giọng nói đa ngôn ngữ, được dùng để vận hành Amazon Alexa+ tại châu Âu
    • Robostral được dùng cho robotics công nghiệp cùng ASML
    • Trong các ứng dụng agent sử dụng nhiều token, tốc độ và hiệu quả cũng quan trọng ngang với hiệu năng thô
  • Chủ quyền và triển khai on-premises

    • BNP Paribas chạy mô hình Mistral on-premises tại Bỉ cho mục đích KYC, giữ dữ liệu nhạy cảm bên trong ngân hàng
    • Abanca sử dụng agent orchestration để xử lý thông tin nhạy cảm của hơn 1 triệu khách hàng trong ứng dụng ở quy mô lớn
    • Với các doanh nghiệp châu Âu trong ngành bị quản lý chặt, đây có thể là lựa chọn thay thế giúp giảm phụ thuộc vào các hyperscaler Mỹ
  • Ứng dụng trong nhân văn học

    • Nhóm nghiên cứu tại Austrian Academy of Sciences đã fine-tune coding LLM Codestral của Mistral để đọc các mảnh papyrus hàng nghìn năm tuổi
    • Công việc này góp phần giúp tiếp cận được bộ sưu tập 180.000 tài liệu được phát hiện ở sa mạc Ai Cập
    • Đây được giới thiệu là công việc sẽ mất hơn 2.000 năm nếu không có AI
    • Dự án Apollo của Austrian Academy of Sciences là ví dụ cho thấy AI cũng có thể đóng góp cho lĩnh vực nhân văn
  • Chiến lược đối tác AI châu Âu

    • Tầm nhìn của Mistral gần với việc trở thành đối tác AI full-stack của châu Âu mang lại ROI thực tế ngay bây giờ hơn là chiến thắng trong cuộc đua AGI
    • Thành bại của chiến lược này sẽ phụ thuộc vào việc có thêm bao nhiêu doanh nghiệp châu Âu chấp nhận cách tiếp cận của Mistral
    • Sự kết hợp giữa mô hình mở, triển khai on-premises và quan hệ đối tác doanh nghiệp có thể hấp dẫn với nhiều tổ chức lớn trong EU
    • Thời kỳ mù quáng phụ thuộc vào các tập đoàn công nghệ lớn của Mỹ đang dần khép lại, và điều quan trọng là một người chơi AI châu Âu nghiêm túc đã xuất hiện

1 bình luận

 
Ý kiến trên Hacker News
  • Tôi thực sự ủng hộ Mistral và các mô hình nhỏ chuyên biệt cho tác vụ, nhưng Mistral đã tụt lại quá xa kể từ sau quý 3 năm 2025
    Muốn cạnh tranh lúc này thì ít nhất cũng phải chạy được mô hình suy luận tốt ở độ dài ngữ cảnh tầm trung, mà Mistral có vẻ không làm được điều đó
    Hiện tại ở mảng mô hình nhỏ, Gemma4 và Qwen3.6 là tốt nhất, còn mô hình “small” của Mistral thì có 120B tham số, tức lớn hơn khoảng 4 lần, nhưng vẫn không cạnh tranh nổi với những mô hình chỉ bằng một phần tư kích thước
    Một năm trước, vào thời Mistral Small 3.1, họ còn theo kịp, nhưng giờ thì gần như không còn hiện diện gì nữa
    Nếu Mistral thật sự nghiêm túc nhắm vào thị trường on-premises và mô hình nhỏ chuyên biệt cho tác vụ, thì việc tạo ra một mô hình đủ khiến cộng đồng r/localLlama hào hứng có thể là một chỉ báo thay thế khá tốt

    • Đồng ý. Tôi là người dùng trả phí Le Chat Pro và rất ủng hộ một lựa chọn thay thế từ châu Âu, nhưng khoảng cách chất lượng giữa Mistral và các phòng thí nghiệm frontier đang ngày càng lớn đến mức khó mà bỏ qua
      Việc họ gần như không nói gì về mô hình mới tại hội nghị cũng đáng lo. Cá nhân tôi nghĩ đó mới là phần họ nên tập trung nhất
      Tôi tự hỏi rốt cuộc thứ gì đang cản trở họ. Là tiền, tài nguyên tính toán, năng lực, hay dữ liệu huấn luyện, tôi không biết
      Muốn làm ra mô hình thực sự tốt thì có lẽ phải huấn luyện bằng những dữ liệu khá đáng ngờ như đầu ra từ các mô hình frontier, mà tôi sợ Mistral lại quá kiểu châu Âu và quá định hướng khách hàng doanh nghiệp nên không dám chấp nhận rủi ro đó
    • Có vẻ Mistral đã bước vào giai đoạn vắt tối đa tiền thuế của người nộp thuế EU mà các công ty công nghệ châu Âu không được doanh nghiệp Mỹ mua lại thường rơi vào
      Cuối cùng có lẽ sẽ kết thúc như Dailymotion, thành một công ty zombie
    • Hơi khác một chút so với câu chuyện mô hình nhỏ chuyên biệt cho tác vụ, nhưng tôi hỏi vì không rõ: có lý do căn bản nào khiến các nhà cung cấp mô hình frontier không tung ra những mô hình nhỏ hơn và tập trung hơn không?
      Ví dụ tôi đang nghĩ đến một mô hình kiểu như tập con chuyên cho phần mềm của Opus, được dùng mặc định trong Claude Code
      Nó sẽ nhỏ hơn, rẻ hơn để triển khai và sử dụng, và có thể còn nhanh hơn
    • Đồng ý. Khi các phòng thí nghiệm frontier thực hiện đợt tăng giá tiếp theo và giới hạn của các gói thuê bao chắc chắn lại bị siết xuống, mọi người sẽ phải nghiêm túc cân nhắc lại nhà cung cấp mô hình hơn nhiều
      Khi đó Mistral cần phải sẵn sàng, nhưng nhìn vào kết quả gần đây thì thực tế tôi không kỳ vọng nhiều
    • Tôi chạy LLM cục bộ, và cá nhân tôi thấy 22B~32B là kích thước tối đa mà tôi còn sẵn sàng thử
      Mistral 4 có 6B tham số hoạt hóa trên mỗi token, nên dù có thể nhét 3~3.5 tham số mỗi token lên 4090 đi nữa, thì khoảng 240GB dung lượng tải về và lưu trữ cũng đã gần chạm giới hạn cho việc thử nghiệm cục bộ rồi
      Nếu ở tình huống phải tải nhiều mô hình về để đánh giá thì lại càng vậy, và cũng khiến người khác khó làm các bản fine-tuning tiếp theo hơn, giống như với các mô hình Mistral/Magistral trước đây
  • Tôi đã nghe một bài nói chuyện từ một quản lý CNTT trong chính phủ rất giỏi, và ông ấy đang đánh giá các mô hình, nhưng rất không hài lòng với tình hình hiện tại
    Ông ấy muốn dùng Mistral, và trong một số trường hợp đó còn là mô hình có trụ sở tại EU duy nhất có thể dùng, nhưng cũng biết rằng hiệu năng của nó thực sự kém và ngày càng tụt hậu
    Có lẽ Mistral vẫn có thể xây dựng một mảng kinh doanh sinh lời chỉ nhờ việc là mô hình duy nhất khả thi cho các nhu cầu trong EU, dù nó không tốt. Thật buồn và khó nhìn

  • Tôi thật sự muốn châu Âu tham gia vào phát triển và nghiên cứu AI, và cũng từng rất ủng hộ Mistral
    Nhưng khoảng cách công nghệ đang tích tụ quá nhiều. Nếu không sửa được điều này, đó sẽ lại là một bằng chứng nữa cho thấy châu Âu không thể vận hành các công ty công nghệ lớn với kết quả tốt
    Trên thực tế, gần như tất cả các phòng lab Trung Quốc đều đang làm tốt hơn rất nhiều. Không cần nói đến DeepSeek, ngay cả những thứ như MiMo 2.5 hay Minimax 2.7 cũng đâu phải do Mistral làm ra
    Các mô hình phía Mistral thì либо yếu hơn, либо lớn hơn và chậm hơn, hoặc chỉ đơn giản là không có mixture-of-experts (MoE), nên không ổn

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      Châu Âu đã tự bắn vào chân mình bằng đạo luật này, được vội vã làm ra vào lúc cơn cuồng loạn đại chúng đang ở đỉnh điểm, và giờ thì không công ty tỉnh táo nào muốn xây thứ gì ở đó nữa
      Startup AI ở Mỹ hay Trung Quốc có thể bắt đầu chỉ với một cậu bé và một chiếc máy tính, còn ở châu Âu thì cậu bé đó cần thêm mười hai luật sư
      Việc Mistral mờ nhạt dần dù có xuất phát điểm sớm, các mô hình đầu tiên rất hứa hẹn và số vốn đã nhận được, có thể là kết quả của việc cố tuân thủ toàn bộ đống quy định đó
    • Tôi không hiểu “khoảng cách công nghệ đang tích tụ quá nhiều” nghĩa là gì. Chẳng phải bắt kịp người dẫn đầu sẽ dễ và rẻ hơn là tự mở đường sao?
    • Về mixture-of-experts (MoE), tôi nhớ Mixtral là mô hình đầu tiên cho thấy tính thực dụng của MoE
      Tôi rất ấn tượng với bản báo cáo kỹ thuật của nó. Tất nhiên tôi biết là bản thân ý tưởng MoE thì đã có từ trước
      Nếu họ tiếp tục đẩy mạnh dòng Mixtral thì biết đâu bây giờ đã có được danh tiếng như họ Qwen hiện nay. Một cơ hội bị bỏ lỡ
    • Chính phủ Anh gần đây công bố sẽ rót 10 triệu bảng vào nghiên cứu AI, nhưng chắc phần lớn sẽ rơi vào túi các công ty tư vấn
      So ra thì tôi thấy châu Âu vẫn đang làm khá ổn
  • BNP Paribas đang chạy mô hình Mistral on-premise tại Bỉ để phục vụ KYC, và điểm quan trọng là dữ liệu nhạy cảm được giữ lại داخل nội bộ ngân hàng
    Abanca cũng đang dùng điều phối tác nhân để xử lý thông tin khách hàng nhạy cảm quy mô lớn, như 2 triệu khách hàng trên ứng dụng của họ
    Với các công ty châu Âu trong những ngành bị quản lý chặt, đây là một lựa chọn thay thế tốt hơn so với phụ thuộc vào các hyperscaler của Mỹ, và việc Mistral tập trung vào mô hình on-premise và lưu trữ tại châu Âu là một hướng đi rất khôn ngoan

    • Nói một cách lịch sự thì tôi không cho rằng đó là chiến lược “rất” khôn ngoan. Nó chỉ là một lựa chọn ổn trong bối cảnh các lựa chọn bị hạn chế
      Ai cũng đang làm kỹ thuật triển khai trực diện hoặc kỹ thuật tùy biến cho khách hàng, vì nếu không thì họ chỉ trông như một công ty cộng biên lợi nhuận lên chi phí token
      Rồi các công ty Neo-SaaS sẽ lấy hết tiền. Ngoài ra thì còn ai sẽ mua AI của Mistral, và họ còn lựa chọn nào khác nữa
    • Việc Mistral mua lại Koyeb để bổ sung năng lực chuyên về triển khai ở quy mô lớn cũng là một quyết định rất chuẩn
    • Tôi nghĩ Mistral không tập trung vào tạo nội dung như mã, hình ảnh hay video
      Thay vào đó, họ dường như tập trung vào các mảng khác như mô hình đa ngôn ngữ, OCR và giọng nói
      Trang giới thiệu mô hình của họ cũng cho thấy điều đó, nhưng nó quá nhiều màu sắc và có quá nhiều danh mục lẫn tên mô hình nên lúc nào tôi cũng thấy rối
      Hy vọng các quyết định của họ sẽ mang lại kết quả tốt
    • Chẳng phải đây là con đường mà các startup EU thường đi sau khi từ bỏ B2C hoặc thị trường SaaS quy mô toàn cầu sao? Tái tập trung vào B2B cho các doanh nghiệp lớn ở châu Âu và các hợp đồng chính phủ
      Với startup châu Âu, B2B doanh nghiệp lúc nào cũng khiến tôi có cảm giác như là nơi để đi chết
    • Dù vậy thì vì sao lại phải dùng Mistral theo kiểu on-premise? Ý tôi là thay vì Qwen
  • Tôi đã tham dự sự kiện, quy mô người tham dự rất ấn tượng và lãnh đạo từ các công ty niêm yết lớn của châu Âu đều có mặt
    Việc có nhiều đối tác được mời cũng rất thú vị. Từ Microsoft, Accenture, EY cho tới các startup như alpic.ai hay lingo.dev đều có
    Có vẻ họ cũng đang đẩy mạnh hoạt động M&A

  • Bỏ qua chuyện kinh doanh thì thiết kế website thực sự rất xuất sắc: https://mistral.ai/

    • Trông quá phức tạp và bố cục các đoạn văn cũng bị lệch
    • Tôi không rõ cụ thể thì có gì hay. Tôi đã lướt trên điện thoại và nó trông như một website công ty khá bình thường
    • Tôi thích toàn bộ phần branding của Mistral
  • Tôi nhận được email từ Mistral nói rằng họ sẽ dần ngừng một số, có lẽ là phần lớn, các mô hình chuyên dụng như devstral vào tháng 8 và giờ bảo dùng mô hình đa dụng
    Chi phí tăng theo cấp số nhân
    Họ nói khuyến nghị chuyển từ Devstral 2(devstral-2512 và devstral-latest) sang mô hình mạnh hơn là Mistral Medium 3.5(mistral-medium-3-5, đặt reasoning_effort thành "high"), với giá $1.5/$7.5 cho mỗi 1 triệu token đầu vào/đầu ra
    Trước đây là $0.4/$2

    • Tôi cũng nhận được email đó, nhưng tôi cứ nghĩ mình đã chuyển mọi thứ sang Mistral-Medium-3.5 rồi nên cũng không rõ mình vẫn còn đang dùng mô hình nào sắp bị ngừng
      Dù sao thì sau khi nhận email, tôi hy vọng đó là tín hiệu cho thấy trong vài tháng tới họ sẽ tung ra những mô hình mới và tốt hơn
  • Có vẻ hoàn toàn không có hào lũy cạnh tranh. Nó giống một công ty tư vấn phần mềm có trung tâm dữ liệu
    Hơn nữa, bài viết còn nói nhiều khách hàng dùng các mô hình này theo kiểu on-premise, nên trung tâm dữ liệu cũng không hẳn là lợi thế
    Có gì ngăn cản bất kỳ startup nào được chính phủ hỗ trợ đi fine-tune các mô hình mã nguồn mở nhỏ chứ

    • Có lẽ là vì nếu chưng cất các mô hình nhỏ từ những mô hình lớn hơn mà họ kiểm soát trực tiếp, thì họ có thể tạo ra mô hình nhỏ tốt hơn so với việc fine-tune dựa trên các mô hình lớn hơn mà họ không kiểm soát
      Tôi không khẳng định đó là sự thật, chỉ là có thể đưa ra giả định như vậy
  • Là một người châu Âu, tôi đồng ý gấp 100 lần
    Trong số những bên chơi này, tôi thực sự thích định hướng và mức độ minh bạch của Mistral

    • Ngay cả khi không phải người châu Âu, việc có một đối thủ châu Âu cạnh tranh với các mô hình Mỹ và Trung Quốc cũng là điều tốt
  • Abanca nói họ dùng điều phối tác nhân để xử lý thông tin khách hàng nhạy cảm ở “quy mô khổng lồ” là 2 triệu khách hàng trên ứng dụng, nhưng tôi không biết có phải chuẩn quy mô khổng lồ của tôi bị lệch không
    2 triệu người dùng thì dữ liệu chắc chỉ cỡ vài trăm MB? Kể cả mỗi người dùng có nhiều dữ liệu thì có lẽ cũng chỉ vài GB

    • Có thể vậy, nhưng nếu xử lý các yêu cầu hỗ trợ khách hàng bằng cách tiếp cận tác nhân với các mô hình ngôn ngữ lớn hiện đại thì số token sẽ tăng rất nhanh
      Theo những gì tôi hiểu từ bài trình bày, họ có vẻ đã dùng các tác nhân với phạm vi trách nhiệm hạn chế và có lẽ là các mô hình nhỏ hơn, để câu trả lời nhanh, ổn định và chi phí không quá lớn
    • Các công ty phục vụ người tiêu dùng ở châu Âu khó mở rộng quy mô dễ dàng như công ty Mỹ, và đây là một phần lớn nguyên nhân khiến châu Âu nói chung gặp khó trong việc nuôi lớn các công ty công nghệ
      Ngược lại, những mô hình kinh doanh như vậy có thể có khả năng phòng thủ khá tốt, nhưng thường cũng không dẫn tới mức lợi nhuận cao tương ứng