1 điểm bởi GN⁺ 4 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Khi việc chính phủ Mỹ hạn chế quyền truy cập Mythos·Fable 5 kéo dài, Sakana AI của Nhật Bản và 360 của Trung Quốc lần lượt nhắm vào khoảng trống này bằng Fugu và Tulongfeng/Yitianzhen
  • Fugu của Sakana AI được giới thiệu là mô hình có thể cạnh tranh với Fable 5·Mythos Preview, được thiết kế như mô hình dành cho agent để điều phối API của nhiều mô hình
  • Tulongfeng của 360 Trung Quốc tập trung vào tự động phát hiện lỗ hổng phần mềm, còn Yitianzhen tập trung vào phòng thủ mạng và tự động hóa ứng phó sự cố
  • Sakana AI nói thời điểm ra mắt là ngẫu nhiên, nhưng nhắm tới doanh nghiệp Nhật Bản và cơ quan chính phủ với thông điệp “năng lực frontier không có rủi ro kiểm soát xuất khẩu”
  • Tầm quan trọng của các mô hình Mỹ vẫn còn, nhưng các hạn chế xuất khẩu đã trở thành chất xúc tác khiến các công ty ở Tokyo và Trung Quốc đẩy nhanh các lựa chọn thay thế khu vực phù hợp với ngôn ngữ và bối cảnh địa phương

Khoảng trống mô hình do hạn chế xuất khẩu Anthropic tạo ra

  • Reuters đưa tin công ty an ninh mạng Trung Quốc 360 đã công bố Tulongfeng vào thứ Tư
    • 360 cho biết Tulongfeng có thể đối đầu với Mythos, mô hình AI chuyên về an ninh mạng của Anthropic
    • Mythos và phiên bản bị giới hạn hơn là Fable 5 hiện không được cung cấp cho người dùng không phải người Mỹ do biện pháp của Chính quyền Trump
  • Đầu cùng tuần, Sakana AI có trụ sở tại Tokyo đã ra mắt Fugu, nghĩa là cá nóc trong tiếng Nhật
    • Fugu được mô tả là “sánh vai với các mô hình dẫn đầu như Fable 5 và Mythos Preview của Anthropic”
    • Mô hình này được thiết kế cho agent và có thể điều phối quyền truy cập API của các mô hình khác
  • Cả hai sản phẩm đều xuất hiện sau 2 tuần kể từ khi chính phủ Mỹ ban hành lệnh liên quan đến Anthropic

Chiến lược Fugu của Sakana AI

  • Người phát ngôn của Sakana AI cho biết việc ra mắt Fugu trùng với hạn chế xuất khẩu Mythos/Fable là “hoàn toàn ngẫu nhiên
    • Tuy nhiên, website của công ty quảng bá “năng lực frontier không có rủi ro kiểm soát xuất khẩu”
    • Sakana AI giải thích rằng họ đã phát triển Fugu từ năm ngoái, và nghiên cứu liên quan đã được trình bày tại ICLR vào mùa xuân năm nay
  • Công ty được đồng sáng lập vào năm 2023 bởi David Ha và Llion Jones, từng làm ở Google, cùng Ren Ito, từng làm ở Mercari và Stability AI
    • Công ty tạo ra các mô hình AI tạo sinh giá rẻ hoạt động tốt ngay cả với tập dữ liệu nhỏ, đồng thời được tối ưu hóa cho tiếng Nhật và văn hóa Nhật Bản
  • Khách hàng mục tiêu của Fugu là các doanh nghiệp Nhật Bản và cơ quan chính phủ muốn giảm mức độ phơi nhiễm trước các biện pháp kiểm soát xuất khẩu ngày càng siết chặt
    • Sakana AI không xem điều này là xu hướng châu Á rời bỏ vĩnh viễn AI của Mỹ
    • Người phát ngôn nói: “các mô hình của Mỹ vẫn quan trọng đối với châu Á”
  • Trong một bài viết trên Project Syndicate, Ren Ito lập luận rằng ưu tiên hàng đầu của chính phủ liên bang Mỹ phải là duy trì quyền tiếp cận cho các đồng minh thân cận, và AI không phải là công nghệ để tích trữ mà là công nghệ cần được cùng phát triển
  • David Ha viết trên X rằng “Orchestration Models are the next frontier, beyond bigger models
    • Ông cho rằng việc phụ thuộc hạ tầng quốc gia vào một nhà cung cấp duy nhất là rủi ro, và các biện pháp kiểm soát xuất khẩu gần đây khiến rủi ro đó không thể bị phớt lờ
    • Viết rằng “Access to top models can disappear overnight”, ông mô tả trí tuệ tập thể như một biện pháp phòng hộ thực dụng trước sự tập trung quyền lực

AI bảo mật của 360 và lập luận về tài sản chiến lược

  • Theo Reuters và Quartz, 360 đã công bố hai công cụ bảo mật AI
    • Tulongfeng: được thiết kế để tự động phát hiện lỗ hổng phần mềm
    • Yitianzhen: được tạo ra để tự động hóa phòng thủ mạng và ứng phó sự cố
  • Theo Reuters, nhà sáng lập 360 Zhou Hongyi xem AI phát hiện lỗ hổng là tài sản chiến lược quốc gia
    • Ông chỉ ra rủi ro “minh bạch một chiều”, khi chỉ một số tác nhân có thể tiếp cận năng lực phát hiện lỗ hổng nâng cao
  • 360 không phản hồi yêu cầu bình luận của TechCrunch

Sự tăng trưởng của Anthropic và sự trỗi dậy của các lựa chọn thay thế khu vực

  • Anthropic từng cho biết doanh thu quy đổi theo năm vào tháng 5/2026 đã vượt 47 tỷ USD
    • Công ty không công bố mức độ phụ thuộc vào khách hàng doanh nghiệp ở châu Á trong con số này
  • Trong vài tuần sau khi lệnh xuất khẩu có hiệu lực, Sakana AI và 360 đã bước vào khoảng trống do việc hạn chế truy cập các mô hình Anthropic tạo ra
  • Ngay cả khi các công ty Mỹ có thể lấy lại niềm tin sau khi lệnh cấm kết thúc, các lựa chọn thay thế khu vực được huấn luyện để hiểu tốt hơn ngôn ngữ và sắc thái địa phương đã bắt đầu lấp đầy khoảng trống này

1 bình luận

 
Ý kiến trên Hacker News
  • Tôi đã thử dùng mô hình Fugu trong công việc thực tế với C# và Unity qua MCP, OpenCode; chỉ một lần review hệ thống theme và lập kế hoạch đổi màu đã dùng hết giới hạn 5 giờ của gói $20
    Tôi nâng lên gói $100 để xem kết quả triển khai, nhưng nó tệ hơn Opus và cực kỳ chậm; dù đã dùng hết giới hạn 5 giờ mới và tiêu tốn 35% giới hạn tuần, nó vẫn gần như không đạt tới mức Opus làm được với ít thời gian và chi phí hơn nhiều
    Thông tin này tùy bạn tự đánh giá, nhưng trông giống như phí tiền

    • Fugu không phải là một mô hình độc lập mà là cấu trúc gọi ngầm nhiều mô hình SaaS hiện có như OpenAI, Anthropic, rồi tổng hợp phản hồi để tạo kết quả
      Họ tuyên bố rằng sau khi kết hợp kết quả từ nhiều mô hình AI rồi dùng mô hình độc quyền riêng để tạo kết quả cuối cùng thì chất lượng sẽ tốt hơn một mô hình backend đơn lẻ, nhưng tôi nghi ngờ liệu mô hình riêng đó có thật sự tồn tại và có đủ năng lực hay không
      Ngay cả nếu tuyên bố đó đúng, việc cho một mô hình có hiệu năng tương tự mô hình nền ở phía client như Claude Code tạo kết quả cuối cùng có vẻ cũng dễ triển khai, và dịch vụ này có mùi đáng ngờ
    • Với tư cách người cung cấp một dịch vụ tương tự cho Godot thay vì Unity, việc dùng các mô hình cao cấp như Opus khiến gói $20 bị dùng hết chỉ với một prompt là khá hợp lý
      Nếu phải trả nguyên giá API và không gánh nổi mức trợ giá 10 lần thì sẽ thành ra như vậy
    • Tôi đã thử Fable trong Cursor; khi hỏi ý tưởng để khiến website dữ liệu mình tạo trông bớt “kiểu Claude” hơn, nó tiêu $40 trong 10 phút và tạo ra phần CSS styling vô dụng nhất, đậm chất Claude nhất
      Bản thân website đó được làm bằng Opus, nên cũng có thể nói kết quả tệ hơn Opus
      Tôi cũng từng có trải nghiệm tương tự với các mô hình Mỹ, nên có lẽ các mô hình châu Á đó cũng thuộc kiểu Mythos
    • Tôi tò mò bạn đang dùng Unity MCP nào
      Tôi đang thử MCP chính thức và muốn biết người khác dùng gì
      Bên coplay nổi tiếng thì tôi gặp xung đột package
    • Với tìm kiếm/nghiên cứu web cũng tương tự, và tệ hơn khi so với Opus
      Nó bỏ sót một nửa, còn nửa còn lại thì là thông tin cũ hoặc chưa được kiểm chứng
  • Fugu Ultra thực ra có vẻ không phải là một mô hình, mà là một hệ thống định tuyến qua nhiều mô hình, gần giống một cloud harness, tương tự Fusion của OpenRouter
    “Không phải một mô hình khổng lồ đơn lẻ; Fugu là một hệ thống điều phối đa tác tử đã được huấn luyện. Đó là một mô hình ngôn ngữ được huấn luyện để định tuyến tác vụ tới một nhóm mô hình nền có thể hoán đổi và gọi đệ quy các instance của chính nó.” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • Cách gọi “Mythos-like” bắt đầu gây khó chịu
    Người dùng thông thường chẳng có cách nào so sánh ngoài việc nhìn benchmark

    • “Mythos-like” đơn giản nghĩa là được thổi phồng bằng tin đồn, và trong trường hợp này dùng vậy là đúng
    • Các startup AI châu Á cũng đưa ra những tuyên bố táo bạo trong khi thực tế không có cách so sánh; trọng tâm trong sự can thiệp của Trump cũng có thể được xem là ngăn không cho Faible được distill
    • Không phải là còn chẳng có benchmark công khai sao?
  • Nếu không có benchmark đáng tin cậy, thì điểm giống Mythos của chúng chỉ là nhận văn bản đầu vào và xuất văn bản đầu ra

    • Giờ tôi gần như không xem benchmark nữa
      Khi có mô hình mới, chúng tôi dùng trực tiếp với codebase phần mềm hệ thống độc quyền quy mô lớn và sản phẩm đã phát hành thực tế, hoặc các dự án một ngày nào đó sẽ phát hành
      Khá rõ mô hình nào giúp làm việc tốt hơn hoặc nhanh hơn, và hiện tại chúng tôi may mắn có ngân sách token đủ dùng theo nhu cầu
      Tôi không cần benchmark, đánh giá, marketing hay system card; trên web tôi chỉ đọc mẹo, cách làm thực tế và tin phát hành
      Tôi chia sẻ trải nghiệm với đồng nghiệp, còn lại đều là nhiễu
    • Nếu nó được thổi phồng như Mythos thì cũng có thể thêm vào danh sách “Mythos-like”
      Có lẽ thứ còn thiếu là cảnh CEO cảnh báo cả thế giới rằng “mô hình của chúng tôi quá nguy hiểm để công bố trên Internet, nên ai đó phải ngăn lại trước khi quá muộn”
    • Trong paper có benchmark: https://arxiv.org/abs/2606.21228
  • Danh sách nhà đầu tư rất ấn tượng: https://sakana.ai/company-info/?lang=en
    Vài ngày trước cũng lên headline HN và có hơn 100 bình luận: https://news.ycombinator.com/item?id=48624782

    • Các công ty này trước đây đã từng phát hành mô hình nào chưa?
      Khó tin rằng họ đột nhiên tung ra một mô hình tầm Mythos
      DeepSeek, Z.ai, Alibaba/Qwen đã làm lâu hơn nhiều và trong 18 tháng qua liên tục ra các mô hình có hiệu năng được cải thiện đều đặn
      Việc các công ty mới không có bản phát hành nào trước đó mà bỗng đưa ra mô hình tầm Mythos là khó tin
    • Năm ngoái họ cũng có một vụ rút lại tuyên bố khá bẽ mặt
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Tôi nghĩ trước khi năm nay kết thúc sẽ có lệnh cấm LLM nước ngoài với lý do “lo ngại an toàn”
    Điều đó sẽ không liên quan đến hiệu năng thực tế
    Nhưng Anthropic đã đặt ra đường cơ sở cho các hệ thống kiểu Mythos, và những thứ khớp với tiêu chuẩn được định nghĩa lỏng lẻo đó có vẻ sẽ bị xem là nguy hiểm với công chúng

    • Thực tế thì chuyện đó có thể vận hành như thế nào?
    • Nếu vậy thì có lẽ sẽ là tạm biệt công nghệ Mỹ và chào đón Trung Quốc
      Sẽ chẳng ai chờ đợi, và không thể nhét vị thần đã chui ra trở lại vào chai
    • Nói như thể dù mô hình tiến bộ cũng không có rủi ro thực sự là điều vô lý
      Tôi có cảm giác như đang sống trong một thực tại khác, nơi hiện tại chỉ có Claude là nói những điều thông minh
      Hầu như mọi bài viết do con người viết đều trông như ảo giác và thứ nhảm nhí để làm màu
  • Nhìn một cách hoài nghi, chỉ cần mô hình đủ ổn thì cũng khó phản bác tuyên bố rằng nó ngang tầm Mythos
    Vì giờ không còn dùng được Mythos nữa

    • Thứ như Mythos là gì vậy?
      Tôi tò mò vì trước đây không có quyền truy cập
  • Ấn tượng đầu tiên là “không có benchmark của bên thứ ba thì biến đi”
    Cá nhân tôi chưa từng nghe đến cả hai công ty này
    Chẳng lẽ cứ bảo tôi tin rằng họ ngang hàng với các mô hình tốt nhất thị trường sao?
    Sakana mô tả mô hình của họ là “Orchestration Model”, vậy thực ra có nghĩa là ghép nhiều mô hình lại với nhau à?

    • Việc tạo ra một mô hình tốt thực sự khó đến thế sao, hay quy mô tài nguyên投入 vào huấn luyện mới là điểm cốt lõi?
      Tôi hỏi vì thật sự không biết
      Tất nhiên chắc không phải chuyện nhỏ, nhưng để xây trên các kỹ thuật hiện có đã được biết đến thì có cần kiến thức bí mật ở đẳng cấp hàng đầu thế giới không?
      Tôi có cảm giác vẫn còn nhiều “trái thấp dễ hái” để khám phá, còn thời gian và tài nguyên mới là yếu tố hạn chế
    • Các bình luận trong bài phát hành gần đây trên HN có vẻ xem nó giống OpenRouter hơn là một mô hình thực sự
    • Theo ấn tượng của tôi thì đúng vậy
      Có vẻ họ tuyên bố đây là một cấu trúc bôi “keo” tức thời theo cách động nào đó, hơn là một hỗn hợp mô hình mới
      Phản ứng khi đó cũng có thể xem ở đây: https://news.ycombinator.com/item?id=48624782 (6 ngày trước, 244 điểm, 133 bình luận)
    • Anthropic có đưa benchmark của bên thứ ba không?
      Lúc đó bạn cũng nói vậy à?
      Việc đó quan trọng thật, nhưng thái độ thì sai rồi
  • Tôi là kiểu người đơn giản: nếu không có benchmark trên https://arena.ai/leaderboard thì cứ coi là lừa đảo 100%

    • So với ARC AGI thì thế nào?
  • Giống như nhiều bình luận ở đây, tôi cũng đã thử Fugu và vài mô hình khác, và chúng khá đắt
    Với $20 thì không đủ để hoàn tất toàn bộ workflow, còn với Opus thì làm được
    Tất nhiên với Opus, nếu muốn kết quả tốt nhất thì có thể vẫn phải tinh chỉnh prompt kỹ hơn ngay từ đầu, nhưng trải nghiệm của tôi đến giờ là vậy
    Bài test tiếp theo tôi sẽ thử bằng hệ thống dạng agent và xem hiệu năng ra sao