GPT-5: Trì hoãn phát hành, bị thổi phồng và không đạt kỳ vọng, và vấn đề nghiêm trọng hơn

(garymarcus.substack.com)

6 điểm bởi GN⁺ 2025-08-11 | 5 bình luận | Chia sẻ qua WhatsApp

GPT-5 không đáp ứng kỳ vọng như mong đợi, và sau khi công bố thực tế đã làm mức thất vọng của cộng đồng tăng lên đáng kể
GPT-5 gần như không có sự khác biệt thực chất so với các mô hình trước, và ở một số benchmark còn xác nhận hiệu năng còn tệ hơn
Nghiên cứu mới nhất cho thấy giới hạn tổng quát hóa và vấn đề dịch chuyển phân phối của các mô hình ngôn ngữ lớn (LLM) vẫn còn nghiêm trọng
Việc mất vị thế dẫn dắt công nghệ của OpenAI, sự ra đi của nhân sự chủ chốt và các đối thủ bám sát khiến triển vọng duy trì giá trị doanh nghiệp trở nên mơ hồ
Khi hoài nghi về tuyên bố hiện thực hóa AGI gia tăng, nhận thức về giới hạn của tiếp cận “mở rộng quy mô thuần túy” đang lan rộng trong toàn ngành

Ra mắt GPT-5 và kỳ vọng

OpenAI cuối cùng đã công bố GPT-5 sau một thời gian dài dự đoán trước đó
CEO Sam Altman đã tận dụng mạnh mẽ các phát biểu đầy tự tin và hình ảnh marketing trước và sau khi công bố
Tuy nhiên, sau khi GPT-5 ra mắt, ngoại trừ một số influencer, phần lớn cộng đồng vẫn chủ yếu thể hiện sự thất vọng
Người dùng thất vọng sâu sắc về mô hình mới, thậm chí xuất hiện cả việc đề xuất khôi phục bản cũ và được thông qua
Khác với marketing và tuyên bố của Altman, phản hồi sau khi sử dụng thực tế nghiêng rõ ràng về đánh giá tiêu cực

Phản ứng của cộng đồng và truyền thông

Trên nhiều cộng đồng như OpenAI Reddit, Hacker News, vấn đề của GPT-5 như lỗi, hallucination (ảo giác)... đã được nêu rất tập trung
Ở các benchmark hiệu năng chính, GPT-5 cũng từng thua kém so với các mô hình đối thủ như Grok 4
Các tính năng mới như auto-routing (định tuyến tự động) cũng bộc lộ sự lộn xộn và thiếu tinh tế
Trong bối cảnh kỳ vọng của cộng đồng tăng nhanh, GPT-5 lại để lại nỗi thất vọng lớn
Trong khảo sát Polymarket ngày phát hành, sự tin tưởng vào vai trò dẫn đầu AI của OpenAI đã giảm từ 75% xuống 14% chỉ trong 1 giờ

Hạn chế cấu trúc: Vấn đề về cờ vua, khả năng thị giác và suy luận

Vấn đề sai lầm suy luận cơ bản và không tuân thủ quy tắc cờ vua mà tác giả và nhiều chuyên gia đã chỉ ra vẫn vẫn tồn tại
Trong các lĩnh vực như tạo ảnh, giới hạn rõ ràng bộc lộ ở mối quan hệ phần-toàn bộ, tính nhất quán thị giác, v.v.
GPT-5 mắc lỗi trong những vấn đề mà cả tiến sĩ cơ khí lẫn người dùng phổ thông cũng không thường mắc phải
Nhiều trường hợp sai sót cũng được báo cáo ở các nhiệm vụ nền tảng như tóm tắt và đọc hiểu
GPT-5 là một mô hình cải tiến theo từng bước, nhưng không có đột phá đáng chú ý so với năm ngoái

Tình hình và triển vọng của OpenAI hiện tại

GPT-5 chỉ dừng ở mức cải tiến dần so với các phiên bản trước, trong khi các điểm yếu nghiêm trọng vẫn lặp lại
Độ tin cậy vào sự dẫn dắt công nghệ của OpenAI trong thị trường và ngành đang giảm
Nhiều nhân sự chủ chốt đã rời đi để thành lập đối thủ hoặc chuyển việc, và Anthropic, Google, Elon Musk đang nhanh chóng đuổi kịp
Áp lực giảm giá, vấn đề lợi nhuận và quan hệ xấu đi với Microsoft làm gia tăng rủi ro cấu trúc
Nghi ngờ về tính khả thi AGI dựa trên LLM cùng sự giảm niềm tin vào CEO Sam Altman tiếp tục đi sâu

Giới hạn nền tảng của LLM: tổng quát hóa và phân phối chuyển dịch

Một nghiên cứu mới của Đại học Arizona State xác nhận rằng ngay cả suy luận Chain of Thought cũng sụp đổ khi thoát khỏi phân phối huấn luyện
Cấu trúc nhạy cảm với dịch chuyển phân phối (distribution shift) mà các hãng khác như Apple đã chỉ ra vẫn được phát hiện tương tự ở các mô hình mới nhất
Đây là nguyên nhân nền tảng khiến LLM liên tục chạm trần giới hạn định tính, và không thể vượt qua chỉ bằng quy mô tham số lớn
Chiến lược mở rộng quy mô đã được đầu tư hàng tỷ đô la nhưng cho thấy thất bại trong việc giải quyết vấn đề bản chất
Nhận thức về nhu cầu tìm kiếm một khung tiếp cận mới đang lan rộng

Toàn ngành AI và giới hạn của ‘mở rộng quy mô’

Marketing phóng đại về AGI, tự động hóa lái xe, timeline viển vông và... đang tràn lan
Các benchmark bóp méo hiệu năng, đánh giá kiểu hộp đen và thiếu minh bạch đều rất nghiêm trọng
Nhiều người bắt đầu nhận ra rằng thuật ngữ AGI là công cụ để làm mê hoặc nhà đầu tư và công chúng
Cả kỳ vọng lạc quan về AI và sự thúc ép cùng lúc đều gia tăng
Thực tế cho thấy cách tiếp cận mở rộng quy mô thuần túy đã chạm tới bức tường khiêng

Lựa chọn thay thế và kết luận

GPT-5 có thể rẻ hơn, nhưng các hạn chế về chất lượng về cờ vua, suy luận, thị giác và toán học vẫn còn
Grok, Claude, Gemini và các mô hình cạnh tranh khác cũng lặp lại các vấn đề tương tự
Vấn đề dịch chuyển phân phối (distribution shift) vẫn còn chưa được giải quyết
Mọi người đưa ra quan điểm rằng giờ đây cần những tiếp cận mới như AI neurosymbolic (neuro-symbolic) và phương thức dựa trên world model
Xác nhận lại rằng đổi mới thuật toán kết hợp, chứ không phải mở rộng thuần túy, là phần tử bắt buộc để đạt được AGI

Dự báo vấn đề kế tiếp và PS

Ngoài các hạn chế của LLM được phát hiện trong tuần này, bài viết gợi ý còn sẽ có một vấn đề khoa học nghiêm trọng khác sắp được làm rõ
Dự kiến sẽ chia sẻ nội dung riêng trong bài đăng tiếp theo

Tóm tắt

Trước và sau khi ra mắt GPT-5, kỳ vọng và phản ứng của ngành/cộng đồng, giới hạn cấu trúc của LLM, tương lai của OpenAI và thực tế của khung AGI đã được bàn luận rộng rãi
Toàn bộ nội dung chỉ ra những hàm ý quan trọng cho startup và nhân sự IT về LLM, giới hạn thực chất của GPT-5, chu kỳ đầu tư/kỳ vọng/thất vọng AI, vấn đề đổi mới và xu hướng nghiên cứu

5 bình luận

gnsdl116 2025-08-12

Có vẻ hơi bi quan quá.
Những điểm lo ngại này thì có thể hiểu được, nhưng tiến trình phát triển công nghệ không thể nào luôn đi lên mãi rồi.

mammal 2025-08-11

Dù sao thì, tác giả đã đăng bài này lại là Gary Marcus — một người chỉ hay nói những điều vô nghĩa — nên...

dongho42 2025-08-11

Nếu như Google chỉ âm thầm làm kiểu show&prove như vậy thì đã không đến mức này đâu; dạo này cứ ầm ĩ nói đủ thứ: lo sợ, bảo là 'sao chết' gì đó, rồi như thể đã chế tạo ra bom hạt nhân, rồi lại chất đầy đủ thứ hype kiểu đó, nên hóa ra đúng là tự chuốc lấy cho mình.