6 điểm bởi GN⁺ 2025-08-11 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • GPT-5 không đáp ứng kỳ vọng như mong đợi, và sau khi công bố thực tế đã làm mức thất vọng của cộng đồng tăng lên đáng kể
  • GPT-5 gần như không có sự khác biệt thực chất so với các mô hình trước, và ở một số benchmark còn xác nhận hiệu năng còn tệ hơn
  • Nghiên cứu mới nhất cho thấy giới hạn tổng quát hóa và vấn đề dịch chuyển phân phối của các mô hình ngôn ngữ lớn (LLM) vẫn còn nghiêm trọng
  • Việc mất vị thế dẫn dắt công nghệ của OpenAI, sự ra đi của nhân sự chủ chốt và các đối thủ bám sát khiến triển vọng duy trì giá trị doanh nghiệp trở nên mơ hồ
  • Khi hoài nghi về tuyên bố hiện thực hóa AGI gia tăng, nhận thức về giới hạn của tiếp cận “mở rộng quy mô thuần túy” đang lan rộng trong toàn ngành

Ra mắt GPT-5 và kỳ vọng

  • OpenAI cuối cùng đã công bố GPT-5 sau một thời gian dài dự đoán trước đó
  • CEO Sam Altman đã tận dụng mạnh mẽ các phát biểu đầy tự tin và hình ảnh marketing trước và sau khi công bố
  • Tuy nhiên, sau khi GPT-5 ra mắt, ngoại trừ một số influencer, phần lớn cộng đồng vẫn chủ yếu thể hiện sự thất vọng
  • Người dùng thất vọng sâu sắc về mô hình mới, thậm chí xuất hiện cả việc đề xuất khôi phục bản cũ và được thông qua
  • Khác với marketing và tuyên bố của Altman, phản hồi sau khi sử dụng thực tế nghiêng rõ ràng về đánh giá tiêu cực

Phản ứng của cộng đồng và truyền thông

  • Trên nhiều cộng đồng như OpenAI Reddit, Hacker News, vấn đề của GPT-5 như lỗi, hallucination (ảo giác)... đã được nêu rất tập trung
  • Ở các benchmark hiệu năng chính, GPT-5 cũng từng thua kém so với các mô hình đối thủ như Grok 4
  • Các tính năng mới như auto-routing (định tuyến tự động) cũng bộc lộ sự lộn xộn và thiếu tinh tế
  • Trong bối cảnh kỳ vọng của cộng đồng tăng nhanh, GPT-5 lại để lại nỗi thất vọng lớn
  • Trong khảo sát Polymarket ngày phát hành, sự tin tưởng vào vai trò dẫn đầu AI của OpenAI đã giảm từ 75% xuống 14% chỉ trong 1 giờ

Hạn chế cấu trúc: Vấn đề về cờ vua, khả năng thị giác và suy luận

  • Vấn đề sai lầm suy luận cơ bản và không tuân thủ quy tắc cờ vua mà tác giả và nhiều chuyên gia đã chỉ ra vẫn vẫn tồn tại
  • Trong các lĩnh vực như tạo ảnh, giới hạn rõ ràng bộc lộ ở mối quan hệ phần-toàn bộ, tính nhất quán thị giác, v.v.
  • GPT-5 mắc lỗi trong những vấn đề mà cả tiến sĩ cơ khí lẫn người dùng phổ thông cũng không thường mắc phải
  • Nhiều trường hợp sai sót cũng được báo cáo ở các nhiệm vụ nền tảng như tóm tắt và đọc hiểu
  • GPT-5 là một mô hình cải tiến theo từng bước, nhưng không có đột phá đáng chú ý so với năm ngoái

Tình hình và triển vọng của OpenAI hiện tại

  • GPT-5 chỉ dừng ở mức cải tiến dần so với các phiên bản trước, trong khi các điểm yếu nghiêm trọng vẫn lặp lại
  • Độ tin cậy vào sự dẫn dắt công nghệ của OpenAI trong thị trường và ngành đang giảm
  • Nhiều nhân sự chủ chốt đã rời đi để thành lập đối thủ hoặc chuyển việc, và Anthropic, Google, Elon Musk đang nhanh chóng đuổi kịp
  • Áp lực giảm giá, vấn đề lợi nhuận và quan hệ xấu đi với Microsoft làm gia tăng rủi ro cấu trúc
  • Nghi ngờ về tính khả thi AGI dựa trên LLM cùng sự giảm niềm tin vào CEO Sam Altman tiếp tục đi sâu

Giới hạn nền tảng của LLM: tổng quát hóa và phân phối chuyển dịch

  • Một nghiên cứu mới của Đại học Arizona State xác nhận rằng ngay cả suy luận Chain of Thought cũng sụp đổ khi thoát khỏi phân phối huấn luyện
  • Cấu trúc nhạy cảm với dịch chuyển phân phối (distribution shift) mà các hãng khác như Apple đã chỉ ra vẫn được phát hiện tương tự ở các mô hình mới nhất
  • Đây là nguyên nhân nền tảng khiến LLM liên tục chạm trần giới hạn định tính, và không thể vượt qua chỉ bằng quy mô tham số lớn
  • Chiến lược mở rộng quy mô đã được đầu tư hàng tỷ đô la nhưng cho thấy thất bại trong việc giải quyết vấn đề bản chất
  • Nhận thức về nhu cầu tìm kiếm một khung tiếp cận mới đang lan rộng

Toàn ngành AI và giới hạn của ‘mở rộng quy mô’

  • Marketing phóng đại về AGI, tự động hóa lái xe, timeline viển vông và... đang tràn lan
  • Các benchmark bóp méo hiệu năng, đánh giá kiểu hộp đen và thiếu minh bạch đều rất nghiêm trọng
  • Nhiều người bắt đầu nhận ra rằng thuật ngữ AGI là công cụ để làm mê hoặc nhà đầu tư và công chúng
  • Cả kỳ vọng lạc quan về AI và sự thúc ép cùng lúc đều gia tăng
  • Thực tế cho thấy cách tiếp cận mở rộng quy mô thuần túy đã chạm tới bức tường khiêng

Lựa chọn thay thế và kết luận

  • GPT-5 có thể rẻ hơn, nhưng các hạn chế về chất lượng về cờ vua, suy luận, thị giác và toán học vẫn còn
  • Grok, Claude, Gemini và các mô hình cạnh tranh khác cũng lặp lại các vấn đề tương tự
  • Vấn đề dịch chuyển phân phối (distribution shift) vẫn còn chưa được giải quyết
  • Mọi người đưa ra quan điểm rằng giờ đây cần những tiếp cận mới như AI neurosymbolic (neuro-symbolic) và phương thức dựa trên world model
  • Xác nhận lại rằng đổi mới thuật toán kết hợp, chứ không phải mở rộng thuần túy, là phần tử bắt buộc để đạt được AGI

Dự báo vấn đề kế tiếp và PS

  • Ngoài các hạn chế của LLM được phát hiện trong tuần này, bài viết gợi ý còn sẽ có một vấn đề khoa học nghiêm trọng khác sắp được làm rõ
  • Dự kiến sẽ chia sẻ nội dung riêng trong bài đăng tiếp theo

Tóm tắt

  • Trước và sau khi ra mắt GPT-5, kỳ vọng và phản ứng của ngành/cộng đồng, giới hạn cấu trúc của LLM, tương lai của OpenAI và thực tế của khung AGI đã được bàn luận rộng rãi
  • Toàn bộ nội dung chỉ ra những hàm ý quan trọng cho startup và nhân sự IT về LLM, giới hạn thực chất của GPT-5, chu kỳ đầu tư/kỳ vọng/thất vọng AI, vấn đề đổi mới và xu hướng nghiên cứu

Chưa có bình luận nào.

Chưa có bình luận nào.