5 điểm bởi GN⁺ 2026-03-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Startup Advanced Machine Intelligence (AMI) do cựu nhà khoa học AI trưởng của Meta, Yann LeCun, đồng sáng lập đã hoàn tất gọi vốn hơn 1 tỷ USD
  • AMI đặt mục tiêu phát triển mô hình thế giới (world model) để hiểu thế giới vật lý và xây dựng một dạng hệ thống AI mới có khả năng suy luận, lập kế hoạch và ghi nhớ
  • LeCun chỉ trích rằng mô hình ngôn ngữ lớn (LLM) không thể đạt tới trí tuệ cấp độ con người, đồng thời cho rằng học tập dựa trên thế giới vật lý là cốt lõi của trí tuệ thực sự
  • Vòng đầu tư có sự tham gia của nhiều nhân vật lớn như Bezos Expeditions, Eric Schmidt, Mark Cuban, và LeCun cũng nhắc tới khả năng hợp tác với Meta
  • AMI theo đuổi phát triển công nghệ mã nguồn mở và có kế hoạch trong tương lai xây dựng mô hình thế giới phổ quát để áp dụng trên toàn ngành

Thành lập AMI và huy động vốn

  • Advanced Machine Intelligence (AMI) là một startup có trụ sở tại Paris, do Yann LeCun đồng sáng lập sau khi rời Meta
    • LeCun là người từng lãnh đạo phòng thí nghiệm Fundamental AI Research (FAIR) của Meta và rời công ty vào tháng 11/2025
  • Trong vòng gọi vốn lần này, công ty đã huy động được hơn 1 tỷ USD, với định giá 3,5 tỷ USD
    • Các nhà đầu tư chính gồm Cathay Innovation, Greycroft, Hiro Capital, HV Capital, Bezos Expeditions
    • Mark Cuban, Eric Schmidt, Xavier Niel cũng tham gia
  • Ngoài Paris, AMI dự kiến vận hành toàn cầu với các văn phòng tại Montreal, Singapore, New York

Triết lý AI của LeCun và phê phán LLM

  • LeCun nhấn mạnh rằng suy luận của con người dựa trên trải nghiệm thế giới vật lý hơn là ngôn ngữ
    • Ông phát biểu: “Ý tưởng rằng chỉ cần mở rộng LLM là có thể đạt tới trí tuệ cấp độ con người là một ảo tưởng hoàn toàn”
  • Ông thừa nhận khả năng sinh mã của LLM, nhưng chỉ ra rằng điều đó không dẫn tới trí tuệ ở mức con người
  • LeCun từng nghiên cứu mô hình thế giới trong Meta với các dự án như Joint-Embedding Predictive Architecture (JEPA), nhưng
    khi Meta chuyển sang chiến lược lấy LLM làm trung tâm, ông quyết định tách ra hoạt động độc lập
    • Ông giải thích: “Ở bên ngoài, chúng tôi có thể phát triển nhanh hơn, rẻ hơn và hiệu quả hơn”

Mục tiêu công nghệ của AMI và ứng dụng công nghiệp

  • AMI đặt mục tiêu phát triển hệ thống AI có bộ nhớ liên tục, khả năng suy luận và lập kế hoạch
    • Hướng tới “AI có thể kiểm soát và an toàn”
  • Các đối tác hợp tác ban đầu được nhắc tới gồm Toyota, Samsung
    • Ví dụ, công ty đề xuất xây dựng mô hình thế giới cho động cơ máy bay để cải thiện hiệu suất và độ tin cậy
  • Về dài hạn, AMI có kế hoạch phát triển mô hình thế giới phổ quát (universal world model) để áp dụng trên diện rộng trong các ngành công nghiệp

Thành phần đồng sáng lập

  • Ngoài LeCun, đội ngũ đồng sáng lập còn có nhiều nhân sự từng làm tại Meta
    • Michael Rabbat (cựu giám đốc khoa học nghiên cứu), Laurent Solly (cựu phó chủ tịch khu vực châu Âu), Pascale Fung (cựu giám đốc nghiên cứu AI)
    • Alexandre LeBrun (cựu CEO Nabla) giữ vai trò CEO của AMI, còn Saining Xie (cựu nhà nghiên cứu Google DeepMind) tham gia với vai trò giám đốc khoa học (CSO)

Mã nguồn mở và tranh luận về quyền kiểm soát AI

  • LeCun nhấn mạnh định hướng phát triển mã nguồn mở, cho rằng AI không nên bị độc quyền bởi một số công ty nhất định
    • Ông nhắc tới vụ Bộ Quốc phòng Mỹ đưa Anthropic vào danh sách đen gần đây để chỉ ra tranh cãi xoay quanh quyền kiểm soát AI
  • Ông phát biểu rằng việc phán định AI là thiện hay ác nên do quy trình dân chủ quyết định, chứ không phải cá nhân
    • Ông cũng nhắc tới trường hợp mạng nơ-ron tích chập (CNN) mà bản thân từng góp phần phát triển đã được dùng trong hệ thống giám sát ở một số quốc gia
  • Về việc sử dụng AI trong quân sự, ông cho biết trước đây từng có phong trào cấm vũ khí tự động, nhưng hiện nay công nghệ này đã phát triển theo hướng phòng thủ, chẳng hạn như drone tự động của Ukraine

Kế hoạch sắp tới

  • AMI dự kiến sẽ sớm công bố mô hình AI đầu tiên, nhưng ở giai đoạn đầu chưa kỳ vọng nhận được sự chú ý lớn từ công chúng
  • Công ty đặt mục tiêu mở rộng phạm vi ứng dụng công nghệ thông qua hợp tác với các đối tác công nghiệp, và về dài hạn phát triển thành hệ thống trí tuệ tổng quát
  • LeCun khép lại với một nụ cười, nói rằng đây là “một kế hoạch rất tham vọng”

1 bình luận

 
GN⁺ 2026-03-11
Ý kiến trên Hacker News
  • Trong world model tồn tại nhiều bậc tự do hơn rất nhiều
    Về bản chất, LLM chỉ học từ văn bản tĩnh, tức dữ liệu ngôn ngữ do con người mô tả về thế giới, nên không thể học trực tiếp từ thế giới thực
    Vì vậy, chúng có thể tái tổ hợp các ý tưởng sẵn có, nhưng gần như không thể tạo ra khám phá sáng tạo hay phát minh thực sự
    Nếu xuất hiện một startup học được hiểu biết không-thời gian dựa trên thế giới vật lý, đó sẽ là nỗ lực nhằm giải quyết nút thắt thật sự trên con đường tới AGI
    Ngay cả khi chỉ thành công một phần, tôi nghĩ điều đó cũng có thể mở ra mức độ khái quát hóa và sáng tạo mà LLM hiện tại về mặt cấu trúc không thể đạt tới

    • Tôi không hiểu quan điểm này
      Theo tôi, nút thắt của AGI nằm ở học liên tục và backpropagation
      Não người không học theo kiểu backpropagation, và world model rốt cuộc cũng không khác mấy so với các cấu trúc deep learning quen thuộc
      Nếu “học từ thế giới” mới là nút thắt, thì chỉ cần cho vision-action LLM chạy trong vòng lặp reinforcement learning với robot hoặc môi trường mô phỏng là được
    • Tôi nghĩ chỉ riêng tri thức tích lũy của nhân loại cũng đã đủ để tạo ra các ý tưởng đổi mới
      Không phải lĩnh vực nào cũng tương tác trực tiếp với thế giới vật lý, và ngay cả chỉ với thông tin trong lịch sử đã được ghi chép, ta cũng có thể tạo mô phỏng ảo nơi các định luật vật lý 3D được áp dụng
      Điều mà LLM hiện thiếu là động lực nội tại — khả năng tự suy nghĩ, tự phản tỉnh và tự sửa mình
      Bản thân tôi cũng sáng tạo trong điều kiện trí nhớ và sự chú ý có hạn, nhưng khi trao đổi với AI tôi vẫn có thêm ý tưởng mới
      Xét cho cùng, tư duy của con người cũng chỉ là sự kết hợp của những gì đã học, và AI cũng là phần nối dài của điều đó
    • LLM hoạt động trong lĩnh vực ngôn ngữ và ký hiệu, nhưng con người còn học được rất nhiều từ trải nghiệm trực tiếp chưa được ngôn ngữ hóa
      Theo điều tôi nghe trong bài giảng của Yann LeCun, trẻ sơ sinh trong vài năm đầu đời trải nghiệm lượng dữ liệu cảm giác lớn hơn nhiều so với dữ liệu mà LLM học được
      Tôi nghĩ đây là giới hạn căn bản của các mô hình dựa trên ngôn ngữ
    • Nếu nhìn một cách hoài nghi, chuyện này chỉ giống như hiện tượng tiền đuổi theo tiền
      LeCun là một người bán hàng rất giỏi, nhưng kể cả thất bại thì xã hội vẫn sẽ bảo vệ ông ấy
      Vì vậy, nói thật là tôi không thấy nể phục
    • LeCun đã chế giễu Gary Marcus suốt 10 năm qua, vậy mà giờ có vẻ lại quay về đúng lập trường đó
      Tenenbaum từ lâu đã nghiên cứu world model rồi, nhưng những người trong văn hóa venture lại không biết rõ các xu hướng nghiên cứu như thế
      Vì thế rất dễ mang ra làm đối tượng đầu tư
  • Tháng 8 năm ngoái, khi ăn trưa cùng Yann, ông ấy nói đang cân nhắc rời Meta
    Tôi đã khuyên ông ấy hãy lập công ty riêng thay vì giúp hiện thực hóa giấc mơ của người khác
    Tôi đồng ý với quan điểm của ông ấy rằng LLM sẽ không dẫn tới trí thông minh cấp độ con người, nhưng không chắc chiến lược world model có phải đáp án đúng hay không

    • Tôi muốn nghe cụ thể hơn xem bạn nghĩ chiến lược nào là con đường tốt hơn
  • Cuối cùng cũng ra dưới dạng startup nhỉ
    Cá nhân tôi thấy mô hình viện nghiên cứu kiểu Mila phù hợp hơn
    Dù vậy, sự nghiệp của LeCun và phản hồi trên X của ông ấy đã tự nói lên tất cả
    Tôi tò mò không biết sẽ kiếm tiền bằng cách nào, nhưng vẫn chúc thành công
    Trong lịch sử, những nghiên cứu có ý nghĩa luôn xuất phát từ các phòng thí nghiệm doanh nghiệp lớn ổn định — Bell Labs, IBM Research, Xerox PARC, MSR, v.v.

  • Ảnh hưởng của Yann là điều không phải bàn cãi, nhưng ngay cả khi có nguồn lực khổng lồ ở Meta, ông ấy cũng không tạo ra kết quả thật nổi bật
    Cách tiếp cận hiểu thế giới qua video thì các mô hình video như Seedance, Kling, Sora đã làm rồi
    Vì vậy tôi không rõ lần này khác biệt đến đâu

    • Đánh giá rằng “không có gì ra đời từ Meta” là không công bằng
      Meta đã công bố rất nhiều nghiên cứu đẳng cấp thế giới và cũng đóng góp lớn cho open source
      Ví dụ, bài báo Beyond Language Modeling: An Exploration of Multimodal Pretraining chứa nhiều insight dựa trên thí nghiệm quy mô lớn
      Tôi nghĩ LeCun đã hoàn thành rất tốt vai trò lãnh đạo nghiên cứu, chứ không phải người chịu trách nhiệm sản phẩm
    • Phần lớn nhà khoa học đâu phải ai cũng làm ra nghiên cứu làm rung chuyển thế giới, nên bỏ qua ý kiến của họ vì lý do đó là không đúng
      Khoa học không phải là một thị trường cạnh tranh
      Và từ “hiểu” chứa quá nhiều nghĩa — các mô hình vẫn cứ lặp lại cùng những lỗi cũ
    • Có nhiều tài nguyên không đồng nghĩa lúc nào cũng cho ra kết quả tốt nhất
      Đôi khi đam mê và tự do mới là động lực quan trọng hơn
    • Một trong những lý do LeCun rời Meta là vì công ty chỉ xoay quanh LLM
      Ông ấy tin rằng LLM không phải con đường dẫn tới AGI
    • Cũng có thể đơn giản là đây là một bài toán quá khó
  • Yann LeCun lập startup world model AMI (Amilabs) với mục tiêu đạt định giá hơn 5 tỷ USD
    Được cho là đã mời LeBrun làm CEO, LeFunde làm CFO, và LeTune phụ trách post-processing
    Xem bài viết TechCrunch

    • Người phụ trách quỹ là LeFunde, người phụ trách fine-tuning là LeTune, đúng là tên quá hoàn hảo
    • Chắc cứ đặt tên là LeLabs luôn cho rồi
    • Có vẻ giờ thế giới đang bị các nominative determinist thống trị
    • Chính sách tuyển dụng nhất quán đến mức nghe như chuyện đùa
  • Xét về thời điểm thì đây cũng là lúc thích hợp
    Cả thế giới đang tập trung quá nhiều vào LLM, nên nghiên cứu các dạng mô hình khác vẫn cần được tiếp tục
    Tôi cũng hy vọng đây sẽ là cơ hội để châu Âu có được một môi trường nghiên cứu AI hấp dẫn

  • Dù có đồng ý với quan điểm của LeCun hay không, tôi nghĩ đây là điều tốt cho châu Âu
    Cần có một viện nghiên cứu đủ mạnh về vốn để đối trọng với hệ sinh thái AI tập trung ở Mỹ và Trung Quốc
    Mistral đã chuyển sang hướng tích hợp và tư vấn, nên mặt trận nghiên cứu tiên phong hiện đang bỏ trống

    • Cách tiếp cận kỹ thuật của AMI nhiều khả năng sẽ dựa trên JEPA
      Nếu tham khảo tài liệu tầm nhìn của LeCun A Path Towards Autonomous Machine Intelligence, có thể thấy khá rõ ý tưởng của ông ấy
      JEPA là một cấu trúc mà startup cũng hoàn toàn có thể thử, và startup 3 người của chúng tôi cũng đã huấn luyện JEPA bằng dữ liệu chuỗi thời gian y tế
      Châu Âu cũng cần một hướng nghiên cứu độc lập như vậy
    • Theo một số bài báo, trụ sở chính dự kiến sẽ đặt tại Singapore
      Bài Straits Times
    • Cá nhân tôi vẫn thích Mistral
      Hiệu năng trên giá thành rất tốt, và cho các tác vụ liên quan đến học ngôn ngữ thì là hàng đầu
    • Với tư cách nhà đầu tư, tôi đã bỏ vào một khoản nhỏ, nhưng cho rằng LeCun nhiều khả năng sẽ giữ vững triết lý của mình
      Nếu góc nhìn của ông ấy đúng thì đây sẽ rất có ích cho châu Âu, còn nếu sai thì chỉ là một khoản đầu tư zero-sum
      Dù vậy, vẫn còn rất nhiều dữ liệu video chưa được khai phá, nên tôi kỳ vọng kết quả tốt
    • Việc có tin LeCun đúng hay không gần như gắn trực tiếp với đánh giá rằng nỗ lực này có tốt cho châu Âu hay không
      Nếu cho rằng LLM đã là đủ và RSI (Recursive Self-Improvement) đang cận kề, thì việc này ngược lại chỉ là sự phân tán chú ý
  • Link bài FT

    • Link không hoạt động. URL gốc bị lặp nên gây ra vòng lặp redirect
  • Thành thật mà nói, tôi vẫn chưa hiểu được cơn sốt world model
    Lý thuyết này đã tồn tại hàng chục năm, trong khi LLM thì thực sự đã thay đổi cả ngành công nghiệp
    Thế nhưng mọi người vẫn cứ nói “không phải LLM, thứ thật sự là world model”

    • Cuối cùng thì tôi nghĩ LLM và world model sẽ hội tụ
      World model dự đoán tương lai, còn LLM cũng có thể được huấn luyện để dự đoán token hình ảnh
      Điều này có thể trở thành một tín hiệu giám sát rất mạnh
    • Thuật ngữ “world model” đang được dùng theo quá nhiều nghĩa khác nhau
      Ngay cả biểu diễn nội bộ mà LLM hình thành trong quá trình học cũng có thể xem là một dạng world model
      Nhưng LLM gần với công nghệ sao chép hơn, và thiếu khả năng học tập hay sáng tạo thực sự
      Ngược lại, cách tiếp cận theo trí thông minh động vật dự đoán các thay đổi của thế giới thực và tự điều chỉnh qua phản hồi
      Tức là một cấu trúc học tập dựa trên hiện thực, có thể giảm hallucination và lập kế hoạch hành động để đạt mục tiêu
      Theo nghĩa đó, “world model” không chỉ là biểu diễn nội bộ đơn thuần mà là một mô hình hành vi học hỏi bằng cách tương tác với thế giới
  • Trong cục diện cạnh tranh AI xoay quanh nước Mỹ, một thử thách mới đến từ châu Âu như thế này mang lại cảm giác mới mẻ
    Các mô hình hiện tại chỉ cạnh tranh bằng cách sao chép lẫn nhau, còn đổi mới thực sự thì còn thiếu