- Startup Advanced Machine Intelligence (AMI) do cựu nhà khoa học AI trưởng của Meta, Yann LeCun, đồng sáng lập đã hoàn tất gọi vốn hơn 1 tỷ USD
- AMI đặt mục tiêu phát triển mô hình thế giới (world model) để hiểu thế giới vật lý và xây dựng một dạng hệ thống AI mới có khả năng suy luận, lập kế hoạch và ghi nhớ
- LeCun chỉ trích rằng mô hình ngôn ngữ lớn (LLM) không thể đạt tới trí tuệ cấp độ con người, đồng thời cho rằng học tập dựa trên thế giới vật lý là cốt lõi của trí tuệ thực sự
- Vòng đầu tư có sự tham gia của nhiều nhân vật lớn như Bezos Expeditions, Eric Schmidt, Mark Cuban, và LeCun cũng nhắc tới khả năng hợp tác với Meta
- AMI theo đuổi phát triển công nghệ mã nguồn mở và có kế hoạch trong tương lai xây dựng mô hình thế giới phổ quát để áp dụng trên toàn ngành
Thành lập AMI và huy động vốn
- Advanced Machine Intelligence (AMI) là một startup có trụ sở tại Paris, do Yann LeCun đồng sáng lập sau khi rời Meta
- LeCun là người từng lãnh đạo phòng thí nghiệm Fundamental AI Research (FAIR) của Meta và rời công ty vào tháng 11/2025
- Trong vòng gọi vốn lần này, công ty đã huy động được hơn 1 tỷ USD, với định giá 3,5 tỷ USD
- Các nhà đầu tư chính gồm Cathay Innovation, Greycroft, Hiro Capital, HV Capital, Bezos Expeditions
- Mark Cuban, Eric Schmidt, Xavier Niel cũng tham gia
- Ngoài Paris, AMI dự kiến vận hành toàn cầu với các văn phòng tại Montreal, Singapore, New York
Triết lý AI của LeCun và phê phán LLM
- LeCun nhấn mạnh rằng suy luận của con người dựa trên trải nghiệm thế giới vật lý hơn là ngôn ngữ
- Ông phát biểu: “Ý tưởng rằng chỉ cần mở rộng LLM là có thể đạt tới trí tuệ cấp độ con người là một ảo tưởng hoàn toàn”
- Ông thừa nhận khả năng sinh mã của LLM, nhưng chỉ ra rằng điều đó không dẫn tới trí tuệ ở mức con người
- LeCun từng nghiên cứu mô hình thế giới trong Meta với các dự án như Joint-Embedding Predictive Architecture (JEPA), nhưng
khi Meta chuyển sang chiến lược lấy LLM làm trung tâm, ông quyết định tách ra hoạt động độc lập
- Ông giải thích: “Ở bên ngoài, chúng tôi có thể phát triển nhanh hơn, rẻ hơn và hiệu quả hơn”
Mục tiêu công nghệ của AMI và ứng dụng công nghiệp
- AMI đặt mục tiêu phát triển hệ thống AI có bộ nhớ liên tục, khả năng suy luận và lập kế hoạch
- Hướng tới “AI có thể kiểm soát và an toàn”
- Các đối tác hợp tác ban đầu được nhắc tới gồm Toyota, Samsung
- Ví dụ, công ty đề xuất xây dựng mô hình thế giới cho động cơ máy bay để cải thiện hiệu suất và độ tin cậy
- Về dài hạn, AMI có kế hoạch phát triển mô hình thế giới phổ quát (universal world model) để áp dụng trên diện rộng trong các ngành công nghiệp
Thành phần đồng sáng lập
- Ngoài LeCun, đội ngũ đồng sáng lập còn có nhiều nhân sự từng làm tại Meta
- Michael Rabbat (cựu giám đốc khoa học nghiên cứu), Laurent Solly (cựu phó chủ tịch khu vực châu Âu), Pascale Fung (cựu giám đốc nghiên cứu AI)
- Alexandre LeBrun (cựu CEO Nabla) giữ vai trò CEO của AMI, còn Saining Xie (cựu nhà nghiên cứu Google DeepMind) tham gia với vai trò giám đốc khoa học (CSO)
Mã nguồn mở và tranh luận về quyền kiểm soát AI
- LeCun nhấn mạnh định hướng phát triển mã nguồn mở, cho rằng AI không nên bị độc quyền bởi một số công ty nhất định
- Ông nhắc tới vụ Bộ Quốc phòng Mỹ đưa Anthropic vào danh sách đen gần đây để chỉ ra tranh cãi xoay quanh quyền kiểm soát AI
- Ông phát biểu rằng việc phán định AI là thiện hay ác nên do quy trình dân chủ quyết định, chứ không phải cá nhân
- Ông cũng nhắc tới trường hợp mạng nơ-ron tích chập (CNN) mà bản thân từng góp phần phát triển đã được dùng trong hệ thống giám sát ở một số quốc gia
- Về việc sử dụng AI trong quân sự, ông cho biết trước đây từng có phong trào cấm vũ khí tự động, nhưng hiện nay công nghệ này đã phát triển theo hướng phòng thủ, chẳng hạn như drone tự động của Ukraine
Kế hoạch sắp tới
- AMI dự kiến sẽ sớm công bố mô hình AI đầu tiên, nhưng ở giai đoạn đầu chưa kỳ vọng nhận được sự chú ý lớn từ công chúng
- Công ty đặt mục tiêu mở rộng phạm vi ứng dụng công nghệ thông qua hợp tác với các đối tác công nghiệp, và về dài hạn phát triển thành hệ thống trí tuệ tổng quát
- LeCun khép lại với một nụ cười, nói rằng đây là “một kế hoạch rất tham vọng”
1 bình luận
Ý kiến trên Hacker News
Trong world model tồn tại nhiều bậc tự do hơn rất nhiều
Về bản chất, LLM chỉ học từ văn bản tĩnh, tức dữ liệu ngôn ngữ do con người mô tả về thế giới, nên không thể học trực tiếp từ thế giới thực
Vì vậy, chúng có thể tái tổ hợp các ý tưởng sẵn có, nhưng gần như không thể tạo ra khám phá sáng tạo hay phát minh thực sự
Nếu xuất hiện một startup học được hiểu biết không-thời gian dựa trên thế giới vật lý, đó sẽ là nỗ lực nhằm giải quyết nút thắt thật sự trên con đường tới AGI
Ngay cả khi chỉ thành công một phần, tôi nghĩ điều đó cũng có thể mở ra mức độ khái quát hóa và sáng tạo mà LLM hiện tại về mặt cấu trúc không thể đạt tới
Theo tôi, nút thắt của AGI nằm ở học liên tục và backpropagation
Não người không học theo kiểu backpropagation, và world model rốt cuộc cũng không khác mấy so với các cấu trúc deep learning quen thuộc
Nếu “học từ thế giới” mới là nút thắt, thì chỉ cần cho vision-action LLM chạy trong vòng lặp reinforcement learning với robot hoặc môi trường mô phỏng là được
Không phải lĩnh vực nào cũng tương tác trực tiếp với thế giới vật lý, và ngay cả chỉ với thông tin trong lịch sử đã được ghi chép, ta cũng có thể tạo mô phỏng ảo nơi các định luật vật lý 3D được áp dụng
Điều mà LLM hiện thiếu là động lực nội tại — khả năng tự suy nghĩ, tự phản tỉnh và tự sửa mình
Bản thân tôi cũng sáng tạo trong điều kiện trí nhớ và sự chú ý có hạn, nhưng khi trao đổi với AI tôi vẫn có thêm ý tưởng mới
Xét cho cùng, tư duy của con người cũng chỉ là sự kết hợp của những gì đã học, và AI cũng là phần nối dài của điều đó
Theo điều tôi nghe trong bài giảng của Yann LeCun, trẻ sơ sinh trong vài năm đầu đời trải nghiệm lượng dữ liệu cảm giác lớn hơn nhiều so với dữ liệu mà LLM học được
Tôi nghĩ đây là giới hạn căn bản của các mô hình dựa trên ngôn ngữ
LeCun là một người bán hàng rất giỏi, nhưng kể cả thất bại thì xã hội vẫn sẽ bảo vệ ông ấy
Vì vậy, nói thật là tôi không thấy nể phục
Tenenbaum từ lâu đã nghiên cứu world model rồi, nhưng những người trong văn hóa venture lại không biết rõ các xu hướng nghiên cứu như thế
Vì thế rất dễ mang ra làm đối tượng đầu tư
Tháng 8 năm ngoái, khi ăn trưa cùng Yann, ông ấy nói đang cân nhắc rời Meta
Tôi đã khuyên ông ấy hãy lập công ty riêng thay vì giúp hiện thực hóa giấc mơ của người khác
Tôi đồng ý với quan điểm của ông ấy rằng LLM sẽ không dẫn tới trí thông minh cấp độ con người, nhưng không chắc chiến lược world model có phải đáp án đúng hay không
Cuối cùng cũng ra dưới dạng startup nhỉ
Cá nhân tôi thấy mô hình viện nghiên cứu kiểu Mila phù hợp hơn
Dù vậy, sự nghiệp của LeCun và phản hồi trên X của ông ấy đã tự nói lên tất cả
Tôi tò mò không biết sẽ kiếm tiền bằng cách nào, nhưng vẫn chúc thành công
Trong lịch sử, những nghiên cứu có ý nghĩa luôn xuất phát từ các phòng thí nghiệm doanh nghiệp lớn ổn định — Bell Labs, IBM Research, Xerox PARC, MSR, v.v.
Ảnh hưởng của Yann là điều không phải bàn cãi, nhưng ngay cả khi có nguồn lực khổng lồ ở Meta, ông ấy cũng không tạo ra kết quả thật nổi bật
Cách tiếp cận hiểu thế giới qua video thì các mô hình video như Seedance, Kling, Sora đã làm rồi
Vì vậy tôi không rõ lần này khác biệt đến đâu
Meta đã công bố rất nhiều nghiên cứu đẳng cấp thế giới và cũng đóng góp lớn cho open source
Ví dụ, bài báo Beyond Language Modeling: An Exploration of Multimodal Pretraining chứa nhiều insight dựa trên thí nghiệm quy mô lớn
Tôi nghĩ LeCun đã hoàn thành rất tốt vai trò lãnh đạo nghiên cứu, chứ không phải người chịu trách nhiệm sản phẩm
Khoa học không phải là một thị trường cạnh tranh
Và từ “hiểu” chứa quá nhiều nghĩa — các mô hình vẫn cứ lặp lại cùng những lỗi cũ
Đôi khi đam mê và tự do mới là động lực quan trọng hơn
Ông ấy tin rằng LLM không phải con đường dẫn tới AGI
Yann LeCun lập startup world model AMI (Amilabs) với mục tiêu đạt định giá hơn 5 tỷ USD
Được cho là đã mời LeBrun làm CEO, LeFunde làm CFO, và LeTune phụ trách post-processing
Xem bài viết TechCrunch
Xét về thời điểm thì đây cũng là lúc thích hợp
Cả thế giới đang tập trung quá nhiều vào LLM, nên nghiên cứu các dạng mô hình khác vẫn cần được tiếp tục
Tôi cũng hy vọng đây sẽ là cơ hội để châu Âu có được một môi trường nghiên cứu AI hấp dẫn
Dù có đồng ý với quan điểm của LeCun hay không, tôi nghĩ đây là điều tốt cho châu Âu
Cần có một viện nghiên cứu đủ mạnh về vốn để đối trọng với hệ sinh thái AI tập trung ở Mỹ và Trung Quốc
Mistral đã chuyển sang hướng tích hợp và tư vấn, nên mặt trận nghiên cứu tiên phong hiện đang bỏ trống
Nếu tham khảo tài liệu tầm nhìn của LeCun A Path Towards Autonomous Machine Intelligence, có thể thấy khá rõ ý tưởng của ông ấy
JEPA là một cấu trúc mà startup cũng hoàn toàn có thể thử, và startup 3 người của chúng tôi cũng đã huấn luyện JEPA bằng dữ liệu chuỗi thời gian y tế
Châu Âu cũng cần một hướng nghiên cứu độc lập như vậy
Bài Straits Times
Hiệu năng trên giá thành rất tốt, và cho các tác vụ liên quan đến học ngôn ngữ thì là hàng đầu
Nếu góc nhìn của ông ấy đúng thì đây sẽ rất có ích cho châu Âu, còn nếu sai thì chỉ là một khoản đầu tư zero-sum
Dù vậy, vẫn còn rất nhiều dữ liệu video chưa được khai phá, nên tôi kỳ vọng kết quả tốt
Nếu cho rằng LLM đã là đủ và RSI (Recursive Self-Improvement) đang cận kề, thì việc này ngược lại chỉ là sự phân tán chú ý
Link bài FT
Thành thật mà nói, tôi vẫn chưa hiểu được cơn sốt world model
Lý thuyết này đã tồn tại hàng chục năm, trong khi LLM thì thực sự đã thay đổi cả ngành công nghiệp
Thế nhưng mọi người vẫn cứ nói “không phải LLM, thứ thật sự là world model”
World model dự đoán tương lai, còn LLM cũng có thể được huấn luyện để dự đoán token hình ảnh
Điều này có thể trở thành một tín hiệu giám sát rất mạnh
Ngay cả biểu diễn nội bộ mà LLM hình thành trong quá trình học cũng có thể xem là một dạng world model
Nhưng LLM gần với công nghệ sao chép hơn, và thiếu khả năng học tập hay sáng tạo thực sự
Ngược lại, cách tiếp cận theo trí thông minh động vật dự đoán các thay đổi của thế giới thực và tự điều chỉnh qua phản hồi
Tức là một cấu trúc học tập dựa trên hiện thực, có thể giảm hallucination và lập kế hoạch hành động để đạt mục tiêu
Theo nghĩa đó, “world model” không chỉ là biểu diễn nội bộ đơn thuần mà là một mô hình hành vi học hỏi bằng cách tương tác với thế giới
Trong cục diện cạnh tranh AI xoay quanh nước Mỹ, một thử thách mới đến từ châu Âu như thế này mang lại cảm giác mới mẻ
Các mô hình hiện tại chỉ cạnh tranh bằng cách sao chép lẫn nhau, còn đổi mới thực sự thì còn thiếu