- Năm nay, 4 tập đoàn Big Tech lớn nhất toàn cầu sẽ chi 344 tỷ USD cho AI, trong đó phần lớn được đầu tư vào các trung tâm dữ liệu phục vụ huấn luyện và vận hành mô hình ngôn ngữ lớn (LLM)
- LLM đã thành công trong việc phổ cập đại chúng, đến mức hơn 700 triệu người dùng ChatGPT mỗi tuần, nhưng tốc độ phát triển đang chậm lại và các giới hạn như ảo giác, chi phí cao, cải thiện hiệu năng ít ỏi đang dần lộ rõ
- DeepSeek của Trung Quốc đã khiến thị trường bất ngờ khi công bố một mô hình nhỏ hơn và hiệu quả hơn, trong khi các công ty như Covariant (robotics), Atman Labs (cách tiếp cận phi deep learning) đang khám phá AI phản ứng với thế giới vật lý
- Theo nghiên cứu gần đây, năng lực suy luận xã hội của LLM phụ thuộc vào một số ít đặc tính nên dễ tổn thương trước những thay đổi nhỏ, và OpenAI cũng thừa nhận khả năng thất bại của các rào chắn an toàn dành cho nhóm dễ tổn thương
- Các chuyên gia chỉ trích LLM chỉ là “trình tạo token”, và cảnh báo rằng sự ám ảnh với một công nghệ duy nhất có thể làm gia tăng bất ổn thị trường, vì vậy cần chuẩn bị cho khả năng trỗi dậy của các cách tiếp cận mới
Khoản đầu tư AI khổng lồ và chủ nghĩa lấy LLM làm trung tâm
- Mọi nhà đầu tư đều biết rằng “không nên bỏ tất cả trứng vào một giỏ”, vậy tại sao Thung lũng Silicon lại đặt cược vào đúng một cách duy nhất để xây dựng trí tuệ nhân tạo (AI)?
- Bốn công ty công nghệ lớn nhất thế giới sẽ đầu tư 344 tỷ USD vào AI trong năm 2025, chủ yếu tập trung xây dựng trung tâm dữ liệu để huấn luyện và chạy mô hình ngôn ngữ lớn (LLM)
- LLM xử lý đầu vào đa phương thức như văn bản, âm thanh và nội dung hình ảnh, đồng thời dựa vào kỹ thuật dự đoán token tiếp theo trong chuỗi
- Chatbot cá nhân đang tăng trưởng nhanh, một số startup AI bắt đầu có doanh thu, và các doanh nghiệp cũng đang cải thiện năng suất ban đầu nhờ AI tạo sinh
- LLM là công nghệ AI đầu tiên đạt mức chấp nhận đại trà, và ChatGPT hiện có hơn 700 triệu người dùng mỗi tuần
- Một số startup đã đạt điểm hòa vốn, nhưng trong các lĩnh vực nhạy cảm như y tế và pháp lý, vấn đề ảo giác vẫn làm hạn chế khả năng giành được niềm tin
Rủi ro của việc ám ảnh với một công nghệ duy nhất
- Tuy nhiên, tập trung vào một công nghệ duy nhất là rất rủi ro. Trước đây đã có những ví dụ thất bại như BlackBerry cố chấp với bàn phím vật lý rồi bị màn hình cảm ứng của Apple vượt mặt, hay Yahoo đặt cược vào cổng thông tin và bị Google thống trị mảng tìm kiếm lấn át
- LLM cũng có nguy cơ đi theo con đường tương tự, và nếu một cách tiếp cận AI mới xuất hiện thì khoản đầu tư khổng lồ hiện tại có thể đối mặt với rủi ro mắc cạn
- DeepSeek của Trung Quốc đã chứng minh khả năng của các cách tiếp cận phi truyền thống khi vào tháng 1 công bố một LLM nhỏ hơn, hiệu quả hơn, đồng thời mở kiến trúc và gây bất ngờ cho thị trường
Tìm kiếm những cách tiếp cận thay thế
- Sự phát triển của AI luôn diễn ra bằng cách kết hợp các hiểu biết trong quá khứ với những ý tưởng mới, và việc theo đuổi máy siêu trí tuệ cũng cần một cách tiếp cận đa chiều
- Các startup như Covariant đang rời khỏi trọng tâm LLM bằng cách phát triển phần mềm nhận thức không gian thay vì chỉ phân tích mẫu dữ liệu
- Các công ty về robotics, drone, khám phá thuốc và mô hình hóa khí hậu cần phản ứng vật lý theo thời gian thực, nên đang rời xa chủ nghĩa lấy LLM làm trung tâm
- Atman Labs tại Anh đang khai quật những ý tưởng bị lãng quên từ trước thời deep learning, phản chiếu cách tiếp cận đa tuyến ban đầu của Google DeepMind (ví dụ: AlphaGo, học tăng cường)
Giới hạn của LLM và vấn đề độ tin cậy
- Giờ đây, logic của mô hình ngôn ngữ lớn đang bắt đầu xuất hiện rạn nứt: từ chi phí cực cao cho tới triển vọng lợi nhuận suy giảm
- Các mô hình mới nhất của OpenAI hay Google chỉ nhỉnh hơn đôi chút so với thế hệ trước, ngay cả khi tiếp tục đổ thêm rất nhiều tiền
- Dù vậy, hiện tượng ảo giác vẫn không biến mất, tiếp tục là rào cản đối với việc triển khai trong doanh nghiệp ở các lĩnh vực như y tế hay phân tích pháp lý
- Một nghiên cứu gần đây trên Nature cho thấy năng lực suy luận xã hội của mô hình ngôn ngữ phụ thuộc vào một số rất ít đặc tính, nên có thể sụp đổ trước những thay đổi nhỏ, đặt ra câu hỏi nền tảng về độ tin cậy
- OpenAI cũng thừa nhận rằng trong các cuộc trò chuyện kéo dài, các rào chắn an toàn dành cho nhóm dễ tổn thương có thể bị phá vỡ; trên thực tế đã xảy ra sự việc cung cấp hướng dẫn tự làm hại bản thân cho một thiếu niên
Chỉ trích trong ngành và triển vọng
- Fei-Fei Li: “Trong tự nhiên không có ngôn ngữ, và thế giới vận hành theo các quy luật vật lý”, qua đó chỉ ra giới hạn của cách tiếp cận lấy ngôn ngữ làm trung tâm
- Alex Karp (CEO của Palantir): chỉ trích rằng “Thung lũng Silicon đã thổi phồng LLM quá mức”
- Yann LeCun: cho rằng LLM là “ngõ cụt” trên con đường tới những cỗ máy thông minh hơn, chỉ là “trình tạo token”, và không thể hiểu môi trường vật lý xung quanh hay lập kế hoạch trước
- Kết lại, LLM sẽ vẫn tiếp tục tồn tại, nhưng ám ảnh với một lời giải duy nhất là rất rủi ro, và các nhà đầu tư cũng như doanh nghiệp cần chuẩn bị cho khả năng xuất hiện một sự chuyển đổi sang mô hình công nghệ mới
Chưa có bình luận nào.