- Năm nay, 4 tập đoàn Big Tech lớn nhất toàn cầu sẽ chi 344 tỷ USD cho AI, trong đó phần lớn được đầu tư vào các trung tâm dữ liệu phục vụ huấn luyện và vận hành mô hình ngôn ngữ lớn (LLM)
- LLM đã thành công trong việc phổ cập đại chúng, đến mức hơn 700 triệu người dùng ChatGPT mỗi tuần, nhưng tốc độ phát triển đang chậm lại và các giới hạn như ảo giác, chi phí cao, cải thiện hiệu năng ít ỏi đang dần lộ rõ
- DeepSeek của Trung Quốc đã khiến thị trường bất ngờ khi công bố một mô hình nhỏ hơn và hiệu quả hơn, trong khi các công ty như Covariant (robotics), Atman Labs (cách tiếp cận phi deep learning) đang khám phá AI phản ứng với thế giới vật lý
- Theo nghiên cứu gần đây, năng lực suy luận xã hội của LLM phụ thuộc vào một số ít đặc tính nên dễ tổn thương trước những thay đổi nhỏ, và OpenAI cũng thừa nhận khả năng thất bại của các rào chắn an toàn dành cho nhóm dễ tổn thương
- Các chuyên gia chỉ trích LLM chỉ là “trình tạo token”, và cảnh báo rằng sự ám ảnh với một công nghệ duy nhất có thể làm gia tăng bất ổn thị trường, vì vậy cần chuẩn bị cho khả năng trỗi dậy của các cách tiếp cận mới
Khoản đầu tư AI khổng lồ và chủ nghĩa lấy LLM làm trung tâm
- Mọi nhà đầu tư đều biết rằng “không nên bỏ tất cả trứng vào một giỏ”, vậy tại sao Thung lũng Silicon lại đặt cược vào đúng một cách duy nhất để xây dựng trí tuệ nhân tạo (AI)?
- Bốn công ty công nghệ lớn nhất thế giới sẽ đầu tư 344 tỷ USD vào AI trong năm 2025, chủ yếu tập trung xây dựng trung tâm dữ liệu để huấn luyện và chạy mô hình ngôn ngữ lớn (LLM)
- LLM xử lý đầu vào đa phương thức như văn bản, âm thanh và nội dung hình ảnh, đồng thời dựa vào kỹ thuật dự đoán token tiếp theo trong chuỗi
- Chatbot cá nhân đang tăng trưởng nhanh, một số startup AI bắt đầu có doanh thu, và các doanh nghiệp cũng đang cải thiện năng suất ban đầu nhờ AI tạo sinh
- LLM là công nghệ AI đầu tiên đạt mức chấp nhận đại trà, và ChatGPT hiện có hơn 700 triệu người dùng mỗi tuần
- Một số startup đã đạt điểm hòa vốn, nhưng trong các lĩnh vực nhạy cảm như y tế và pháp lý, vấn đề ảo giác vẫn làm hạn chế khả năng giành được niềm tin
Rủi ro của việc ám ảnh với một công nghệ duy nhất
- Tuy nhiên, tập trung vào một công nghệ duy nhất là rất rủi ro. Trước đây đã có những ví dụ thất bại như BlackBerry cố chấp với bàn phím vật lý rồi bị màn hình cảm ứng của Apple vượt mặt, hay Yahoo đặt cược vào cổng thông tin và bị Google thống trị mảng tìm kiếm lấn át
- LLM cũng có nguy cơ đi theo con đường tương tự, và nếu một cách tiếp cận AI mới xuất hiện thì khoản đầu tư khổng lồ hiện tại có thể đối mặt với rủi ro mắc cạn
- DeepSeek của Trung Quốc đã chứng minh khả năng của các cách tiếp cận phi truyền thống khi vào tháng 1 công bố một LLM nhỏ hơn, hiệu quả hơn, đồng thời mở kiến trúc và gây bất ngờ cho thị trường
Tìm kiếm những cách tiếp cận thay thế
- Sự phát triển của AI luôn diễn ra bằng cách kết hợp các hiểu biết trong quá khứ với những ý tưởng mới, và việc theo đuổi máy siêu trí tuệ cũng cần một cách tiếp cận đa chiều
- Các startup như Covariant đang rời khỏi trọng tâm LLM bằng cách phát triển phần mềm nhận thức không gian thay vì chỉ phân tích mẫu dữ liệu
- Các công ty về robotics, drone, khám phá thuốc và mô hình hóa khí hậu cần phản ứng vật lý theo thời gian thực, nên đang rời xa chủ nghĩa lấy LLM làm trung tâm
- Atman Labs tại Anh đang khai quật những ý tưởng bị lãng quên từ trước thời deep learning, phản chiếu cách tiếp cận đa tuyến ban đầu của Google DeepMind (ví dụ: AlphaGo, học tăng cường)
Giới hạn của LLM và vấn đề độ tin cậy
- Giờ đây, logic của mô hình ngôn ngữ lớn đang bắt đầu xuất hiện rạn nứt: từ chi phí cực cao cho tới triển vọng lợi nhuận suy giảm
- Các mô hình mới nhất của OpenAI hay Google chỉ nhỉnh hơn đôi chút so với thế hệ trước, ngay cả khi tiếp tục đổ thêm rất nhiều tiền
- Dù vậy, hiện tượng ảo giác vẫn không biến mất, tiếp tục là rào cản đối với việc triển khai trong doanh nghiệp ở các lĩnh vực như y tế hay phân tích pháp lý
- Một nghiên cứu gần đây trên Nature cho thấy năng lực suy luận xã hội của mô hình ngôn ngữ phụ thuộc vào một số rất ít đặc tính, nên có thể sụp đổ trước những thay đổi nhỏ, đặt ra câu hỏi nền tảng về độ tin cậy
- OpenAI cũng thừa nhận rằng trong các cuộc trò chuyện kéo dài, các rào chắn an toàn dành cho nhóm dễ tổn thương có thể bị phá vỡ; trên thực tế đã xảy ra sự việc cung cấp hướng dẫn tự làm hại bản thân cho một thiếu niên
Chỉ trích trong ngành và triển vọng
- Fei-Fei Li: “Trong tự nhiên không có ngôn ngữ, và thế giới vận hành theo các quy luật vật lý”, qua đó chỉ ra giới hạn của cách tiếp cận lấy ngôn ngữ làm trung tâm
- Alex Karp (CEO của Palantir): chỉ trích rằng “Thung lũng Silicon đã thổi phồng LLM quá mức”
- Yann LeCun: cho rằng LLM là “ngõ cụt” trên con đường tới những cỗ máy thông minh hơn, chỉ là “trình tạo token”, và không thể hiểu môi trường vật lý xung quanh hay lập kế hoạch trước
- Kết lại, LLM sẽ vẫn tiếp tục tồn tại, nhưng ám ảnh với một lời giải duy nhất là rất rủi ro, và các nhà đầu tư cũng như doanh nghiệp cần chuẩn bị cho khả năng xuất hiện một sự chuyển đổi sang mô hình công nghệ mới
2 bình luận
Từ GPT-5 trở đi có thể thấy họ đang cố gắng kéo hiệu năng lên bằng suy luận, mà ngay cả điều đó cũng có vẻ không dễ. Những câu trả lời vốn chỉ cần dừng ở mức vừa đủ thì giờ lại dài tới vài chục dòng, thật sự quá áp lực. hu hu
Ý kiến Hacker News
Xem tại https://archive.is/2rFK4
Công nghệ này trông cực kỳ ấn tượng trong các bản demo, và có thể thấy mọi người tại hiện trường thật sự rất hào hứng; khi nhìn đồng nghiệp hay lãnh đạo tự hào trình diễn hoặc đùa mãi không dứt, tôi có cảm giác khá giống thời người ta lần đầu cầm điện thoại di động rồi khoe với người khác, nên dễ sinh ra xu hướng nhìn nhận nó bị thổi phồng hơn giá trị thực; đây vẫn là một bước tiến có ý nghĩa giống như điện thoại di động, nhưng trong ngắn hạn sẽ không tạo ra tác động lớn như mức độ cường điệu, nhất là trên các diễn đàn ẩn danh thường có nhiều ý kiến chỉ ra rằng “thứ này bị thổi phồng quá mức”, còn trong vai trò nghề nghiệp thì mọi người lại cùng hùa theo bầu không khí đó, như thể ai cũng biết chuyện gì đang diễn ra nhưng vẫn mong bữa tiệc tiếp tục
Nếu sếp của tôi quá nhấn mạnh AI và bảo toàn bộ nhân viên phải all-in, thì trong thị trường việc làm khó khăn như hiện nay, nhiều người sẽ hùa theo vì sợ hãi; đặc biệt là khi AI đang làm giảm số lượng việc làm nên lại càng như vậy; một số người chỉ lặng lẽ tiếp tục dùng những công cụ thực tế phù hợp với mình như LSP hay refactoring, còn trong môi trường chuyên môn thì chỉ có số ít đủ can đảm để nói rằng “hoàng đế không mặc quần áo”
Điều thú vị là trên các diễn đàn ẩn danh, lại thường thấy rất nhiều ý kiến cho rằng AI là một cuộc cách mạng sẽ thay đổi cả đời người; ít nhất là khi họ không giả vờ làm chuyên gia thì quan điểm này dễ thấy hơn; khi ở trong vai trò nghề nghiệp thì chia thành hai nhóm: những người vốn dùng AI ở ngoài lĩnh vực chuyên môn của mình thì ca ngợi quá đà như thể lần đầu chứng kiến cuộc cách mạng điện thoại di động, nhưng khi áp dụng AI vào đúng lĩnh vực chuyên môn của mình, họ trực tiếp cảm nhận được rằng AI có phần bị đánh giá quá cao nên trở thành những người lạc quan thận trọng hơn; ngược lại, những người vốn là người dùng AI giỏi nhất ngay trong lĩnh vực của mình thì vẫn tích cực, nhưng phần lớn khá điềm tĩnh, theo kiểu nó hoạt động tốt trong những môi trường có giới hạn
Rất dễ quên rằng vẫn còn nhiều “trái thấp dễ hái” để khai thác tối đa công nghệ này; ngay lúc này người ta vẫn chỉ mới thử những tích hợp rất cơ bản; dù đang ở giai đoạn đầu, bạn vẫn có thể làm những thứ cực kỳ hay với LLM; ví dụ như dùng Cursor để hiện đại hóa một codebase cũ và xây dựng những tính năng mới mà từ lâu tôi vẫn muốn có; tôi chỉ tốn vài giờ, trong khi theo cách cũ có lẽ phải mất 1-2 tuần; tiềm năng vì thế là rất lớn, dù sự cường điệu hiện nay thực ra hơi xa với trải nghiệm của tôi nên cách nhìn của tôi có thể khác
Hệ thống này không có error bar hay khoảng tin cậy; rốt cuộc nó chỉ là một kẻ lắm lời có đúng một “sở trường” là tạo ra kết quả thoạt nhìn có vẻ hợp lý; dĩ nhiên có nhiều lĩnh vực ứng dụng phù hợp, nhưng vẫn còn quá nhiều lỗ hổng mà ngay cả quy mô cũng không thể dự đoán và không thể sửa được, nên hiệu quả của nó có giới hạn
So sánh với smartphone khá thú vị; smartphone rõ ràng đã thay đổi thế giới, và dù có rất nhiều hype thì cuối cùng đó vẫn là thay đổi thực chất; tôi tò mò không biết bạn có nghĩ LLM và AI cũng sẽ tạo ra thay đổi thật sự như vậy không
Tôi thắc mắc kế hoạch thu hồi số vốn đầu tư này là gì; giả sử mọi tập đoàn lớn ở Mỹ đều trả 100.000 USD phí thuê bao mỗi năm, và mọi hộ gia đình đều trả 20 USD mỗi tháng, thì xét cả chi phí suy luận và các chi phí phụ trợ khác, có vẻ vẫn hoàn toàn không đủ để hoàn vốn; hay là phải có một khám phá mới trong lĩnh vực y tế chẳng hạn, ví dụ tin về gpt-bio và iPSC của OpenAI thực sự rất ấn tượng, nhưng vẫn còn rất lâu mới thương mại hóa được; tôi muốn biết kế hoạch thực sự là gì
Tôi nhớ mục tiêu ban đầu là AGI; không phải nhắm ROI từ các dịch vụ AI hiện tại; cấu trúc là mọi người đổ tiền vào như mua vé số vì nếu AGI xuất hiện thì sẽ độc chiếm được nó; chỉ là trong một năm qua không có tiến bộ theo cấp số nhân nên bầu không khí mơ về AGI có phần chững lại
Kế hoạch ngay từ đầu đã nhắm vào lao động của con người; một số nghề đã bị AI thay thế hoàn toàn, còn phần còn lại thì được tăng năng suất rất mạnh; giá trị kinh tế của điều đó là khổng lồ; ngay cả khi chưa có AGI, tự động hóa dựa trên AI hiện vẫn đang thay thế nghiêm trọng nhóm lao động “rẻ nhất và dễ thay thế nhất”; những công việc trước đây từng được outsource sang tổng đài ở Ấn Độ đang dần chuyển sang data center; các công ty AI lớn tin rằng chỉ cần tiếp tục đầu tư vào R&D và compute thì cuối cùng sẽ tiến tới AGI
Nếu AI không sa thải bạn, thì AI không thể tự trả được chi phí cho chính nó
If AI Doesn’t Fire You, It Can’t Pay For Itself
Nếu LLM có thể nâng hiệu suất của toàn bộ lực lượng lao động cổ cồn trắng lên gấp đôi, thì các tập đoàn lớn sẽ buộc phải trả nhiều hơn rất nhiều chứ không phải chỉ 100.000 USD mỗi năm; nếu họ chỉ cần trả 25% của phần chi phí tiết kiệm được nhờ thay thế một nửa số việc làm, thì doanh thu tạo ra đã đủ khiến định giá doanh nghiệp hiện tại trông cực kỳ rẻ
100.000 USD mỗi năm thực ra gần như chẳng là gì; tính ra khoảng 10 nghìn USD cho mỗi nhân viên, và ngay cả khi lấy 100.000 USD là tổng lương cùng phúc lợi cho mỗi người thì chỉ cần năng suất nhân sự tăng 10% cũng đã là tác động rất lớn; với công ty 10.000 người thì đó là quy mô 100 triệu USD mỗi năm
Tôi không có trực giác rõ ràng về 344 tỷ USD lớn tới mức nào, nhưng tổng vốn hóa toàn thị trường chứng khoán Mỹ là 62,8 nghìn tỷ USD; tỷ lệ CAPE của Shiller (giá hiện tại/lợi nhuận trung bình 10 năm) vào khoảng 38 lần, nghĩa là lợi nhuận bình quân năm trong 10 năm là khoảng 1,7 nghìn tỷ USD; vì vậy 344 tỷ tương đương khoảng 1/5 lợi nhuận bình quân năm của thị trường chứng khoán Mỹ; như vậy có lẽ dễ hình dung hơn một chút
Dạo này tôi tự quản lý danh mục và điều chỉnh lợi suất kỳ vọng (GDP+cổ tức) theo rủi ro để tính lợi nhuận dự kiến theo từng quốc gia/khu vực, rồi tái cân bằng khoảng một hai lần mỗi năm; nếu giả định thứ này gần như toàn là bong bóng, tôi tò mò không biết nên điều chỉnh lợi nhuận của thị trường Mỹ như thế nào, nhất là khi muốn áp dụng vào đầu tư theo dõi nhóm cổ phiếu xoay quanh AI
Tuy nhiên 344 tỷ USD là con số lũy kế chứ không phải theo năm
Thứ đang tồn tại hiện nay là một giao diện tuyệt vời, cho phép người dùng tiếp cận các hệ thống cực kỳ phức tạp cho công việc hoặc mục đích cá nhân mà gần như không có ma sát; nhưng đó không phải bản chất cốt lõi của vấn đề, hiện giờ nó vẫn chỉ là một lớp vỏ mỏng; tôi nghi ngờ cuộc cách mạng này rốt cuộc có đáng giá tới hàng nghìn tỷ USD hay không, nhưng may là đây không phải điều tôi phải bận tâm nên cũng thấy nhẹ đầu
“Bài báo” này là kiểu giật tít câu click; chỉ có tiêu đề kích thích chứ gần như không có nội dung thực chất; nó chỉ ném ra những câu hỏi vô nghĩa kiểu “trong một số trường hợp thì hữu ích, vậy tại sao các tập đoàn lớn lại đầu tư thế này, trong khi R&D thuần túy có thể tốt hơn”
Cũng như thời phim ảnh mới xuất hiện, người ta từng lo mình sẽ bị tàu hỏa trên màn ảnh tông phải, thì giờ tôi cũng đang đứng về phía những người tin rằng máy móc đang suy nghĩ
Thị trường hiện tại chắc chắn đang có bong bóng; gần đây số startup ứng dụng AI bùng nổ, và vì phải cố khác biệt trong cùng một nhóm sản phẩm nên mọi chi tiết kỹ thuật đều bị biến thành câu chữ marketing; từ góc nhìn của ban lãnh đạo, dù có mười startup cùng hứa “chỉ cần train bằng dữ liệu của chúng tôi là sẽ có chatbot tốt nhất”, họ cũng khó mà phân biệt được đó là huấn luyện thật sự hay chỉ là chỉnh prompt; chuyện này trước đây cũng từng xảy ra, ví dụ tiêu biểu nhất là “deep research” và những thứ tương tự; kiểu marketing này có thể giúp tăng trưởng nhưng lại làm xói mòn niềm tin; thực tế là có một startup gần đây gọi đó là “learning dựa trên trải nghiệm” trong khi thực chất chỉ thêm memory vào prompt để tăng hiệu năng, vậy mà vẫn gọi được vòng Series A (bạn có thể tự tìm); nhưng điều đó không có nghĩa là không có ý tưởng đổi mới nào đang diễn ra; cá nhân tôi cho rằng pretraining đã hoàn toàn đạt được mục đích được đặt ra ban đầu; trước đây mục đích đó vốn còn khá mơ hồ, nhưng khi RL nổi lên thì người ta dần hiểu một cách mơ hồ; pretraining và compute trong môi trường test là cốt lõi để tích lũy các priors tổng quát, tức là khả năng giải quyết nhiều loại vấn đề như con người; đôi khi nếu chưa đủ tốt thì cần huấn luyện bổ sung bằng RLVR, và dù vẫn còn ở giai đoạn đầu, tôi lạc quan rằng theo hướng này sẽ còn có thêm một đường cong mở rộng quy mô nữa
Các công ty bắt buộc phải đầu tư vào AI, bất kể họ có nhiều tiền hay ít, vì mô hình kinh doanh hiện tại của họ đang bị LLM đe dọa nên họ phải chủ động đi trước; nếu không thể dẫn đầu thì toàn bộ nền kinh tế Mỹ cũng có nguy cơ rung chuyển; nếu Big Tech Mỹ mất doanh thu quảng cáo toàn cầu (Meta, Google), họ có thể nhanh chóng chỉ còn là cái vỏ rỗng, bởi vì nếu từng quốc gia hoặc từng khối kinh tế tự làm và tự triển khai sản phẩm của mình thì việc thay thế sản phẩm Mỹ sẽ trở nên quá dễ; nền kinh tế Mỹ trên thực tế đã phụ thuộc quá nhiều vào dòng tiền của FAANG, và chính số tiền đó là động lực vận hành các ngành khác nữa; vì vậy tôi cũng hiểu vì sao lại có các bữa tối với Trump; nếu thế cục AI này suy yếu thì nước Mỹ sẽ phải đối mặt với một tương lai rất bất ổn cả về kinh tế
Lý do Oracle đang có những biến động cực lớn trên thị trường là vì tin OpenAI cam kết chuyển một khối lượng workload khổng lồ sang cloud của họ; thực chất đây là một chiến lược “kỹ thuật” tài chính ưu tiên doanh thu hơn lợi nhuận, đặc biệt là bằng cách đẩy càng nhiều CapEx về tương lai càng tốt; nói ngắn gọn, đây là một ví dụ cho thấy bong bóng AI hiện tại đang quá đà đến mức nào; theo một bài phân tích gần đây của Economist, thị trường giờ đây không còn vận hành theo “rủi ro” mà theo “nỗi sợ thua lỗ” hay “nỗi sợ bị bỏ lỡ (FOMO)”, và hiện tại FOMO đã lên đến cực điểm
Want better returns? Forget risk, focus on fear (Economist)
Đợt tăng dựng đứng lần này của Oracle cùng với dự báo doanh thu khiến tôi có cảm giác hoàn toàn là kiểu ‘jumping the shark’; với đặc tính của Oracle như một công ty, tôi vốn khá thận trọng khi đặt cược, nhưng lần này thậm chí còn thấy bị cám dỗ muốn mở vị thế short
FOMO thật sự đang rất nghiêm trọng; thị trường chứng khoán hiện nay đang vận động giống hệt bong bóng crypto trước đây