2 điểm bởi GN⁺ 2025-12-03 | 3 bình luận | Chia sẻ qua WhatsApp
  • OpenAI đã khẩn cấp chuyển sang mức ‘code red’ để cải thiện chất lượng ChatGPT, nhằm khôi phục lợi thế đang lung lay trước sự bám đuổi của Google
  • Hiện các tính năng cốt lõi như cá nhân hóa, tốc độ, độ tin cậy, mở rộng phạm vi câu hỏi có thể trả lời đang cần được bổ sung gấp; vì vậy mọi dự án mới như quảng cáo, Pulse, agent y tế, agent mua sắm đều bị dừng hoặc trì hoãn
  • Gemini 3 của Google gần đây đã vượt mô hình OpenAI trên nhiều benchmark, và thành công của mô hình hình ảnh Nano Banana đã khiến MAU tăng vọt từ 450 triệu → 650 triệu, trở thành mối đe dọa lớn
  • OpenAI cũng đang chịu áp lực tài chính ngày càng lớn, với cam kết đầu tư trung tâm dữ liệu trị giá hàng trăm tỷ USD và nhu cầu đạt doanh thu thường niên 200 tỷ USD vào năm 2030; sự tăng trưởng khách hàng doanh nghiệp của Anthropic cũng là một yếu tố cạnh tranh
  • OpenAI đang vận hành cơ chế kiểm tra hằng ngày và tái phân bổ đội ngũ, đồng thời nội bộ cho biết mô hình suy luận (reasoning) mới sắp công bố đang vượt phiên bản Gemini mới nhất, cho thấy đây là bước ngoặt quan trọng để giành lại thế chủ động

Kích hoạt code red và kế hoạch cải thiện ChatGPT

  • Một bản ghi nhớ nội bộ cho thấy OpenAI đã kích hoạt ‘code red’ — mức khẩn cấp cao nhất để giải quyết các vấn đề của ChatGPT
    • OpenAI sử dụng hệ thống cảnh báo 3 cấp yellow → orange → red, và động thái lần này là nâng thêm một bậc từ code orange
  • Phạm vi cải thiện bao gồm tăng cường cá nhân hóa, cải thiện tốc độ phản hồi, nâng độ tin cậy của máy chủ, mở rộng phạm vi câu hỏi có thể trả lời, tức là toàn bộ trải nghiệm người dùng
  • Để làm điều này, mọi dự án mới như quảng cáo, Pulse (trợ lý cá nhân), agent y tế và mua sắm đều bị đẩy xuống ưu tiên thấp hơn
    • Công ty khuyến khích tái phân bổ nhân sự trên toàn tổ chức và quyết định vận hành daily call chuyên trách để kiểm tra tiến độ phát triển mỗi ngày
  • Gần đây đã xuất hiện các phàn nàn về GPT-5 như giọng điệu lạnh lùng, lỗi ở các câu hỏi cơ bản, và điều này cũng bao gồm việc điều chỉnh lại giọng điệu mô hình cùng khả năng thực hiện chỉ dẫn

Sức ép cạnh tranh từ Google Gemini

  • Gemini 3, mô hình mới nhất của Google, đang vượt OpenAI trên nhiều benchmark trong ngành, cho thấy cục diện cạnh tranh đã bị xáo trộn đáng kể
    • Ngay sau khi Gemini được công bố, giá cổ phiếu Google đã tăng và hiệu năng của mô hình được thị trường đặc biệt chú ý
  • Kể từ sau khi mô hình tạo ảnh Nano Banana ra mắt vào tháng 8, số người dùng hoạt động hằng tháng (MAU) của toàn bộ mảng AI của Google đã
    • tăng mạnh từ 450 triệu vào tháng 7 → 650 triệu vào tháng 10
  • Anthropic cũng đang mở rộng tệp khách hàng doanh nghiệp, cho thấy lợi thế áp đảo của OpenAI không còn vững chắc
  • Bài viết mô tả đây là tình huống trớ trêu khi ‘code red’ mà Google từng công bố ngay sau sự xuất hiện của ChatGPT giờ đây lại quay trở về phía OpenAI

Đầu tư, áp lực tài chính và sự bất an của thị trường

  • Theo các hợp đồng với Microsoft và Amazon, OpenAI đã ký thỏa thuận điện năng cho trung tâm dữ liệu quy mô 36GW,
    • điều có thể khiến chi phí thuê trung tâm dữ liệu hằng năm trong tương lai lên tới 620 tỷ USD
  • Dự báo nội bộ cũng cho thấy để chuyển sang có lãi vào năm 2030, OpenAI sẽ cần khoảng 200 tỷ USD doanh thu mỗi năm
  • Dù không có kế hoạch IPO, OpenAI
    • vẫn có cấu trúc tài chính gắn chặt với giá cổ phiếu của các tập đoàn công nghệ lớn như Nvidia, Oracle, Microsoft, từ đó tác động đến toàn thị trường
  • OpenAI vẫn đang thua lỗ và được đánh giá là có cấu trúc khó tồn tại nếu không tiếp tục huy động vốn quy mô lớn

Hé lộ mô hình mới và sự tự tin nội bộ

  • Trong bản ghi nhớ, Altman nhắc đến việc mô hình suy luận (reasoning) mới sẽ được công bố vào tuần tới đang vượt phiên bản Gemini mới nhất của Google
    • Đây có vẻ là yếu tố giúp nâng tinh thần nội bộ, đồng thời nhấn mạnh tiềm năng tăng trưởng và quyết tâm giành lại vị thế dẫn đầu của ChatGPT
  • ChatGPT vẫn sở hữu nền tảng người dùng rất mạnh với hơn 800 triệu người dùng hằng tuần, và
    • OpenAI có kế hoạch duy trì đà tăng trưởng bằng cách tiếp tục cải thiện tốc độ, độ chính xác và cá nhân hóa

Bối cảnh tổng thể

  • Trong bối cảnh cạnh tranh gia tăng (Google, Anthropic), tranh cãi về chất lượng sản phẩm và chi phí hạ tầng khổng lồ cùng lúc xuất hiện,
    việc khôi phục chất lượng cốt lõi của ChatGPT đang trở thành chiến lược sống còn và ưu tiên cấp bách nhất của OpenAI

3 bình luận

 
slowandsnow 2025-12-04

Các vấn đề của ChatGPT
Có quá nhiều lỗi. Nhấn gửi nhưng không tạo tin nhắn, hoặc đang stream tin nhắn thì báo lỗi rồi toàn bộ biến mất, v.v. Deep Research còn có ít nguồn hơn cả chế độ suy luận. Không còn lý do để dùng Deep Research nữa.
Các vấn đề của Codex
Quá chậm. Công việc mà Claude Code làm trong 5 phút thì ở Codex mất hơn 10 phút. Quá ngốc

 
yinn27 2025-12-04

Nhưng chẳng phải Gemini cũng bất tiện hơn ChatGPT về UI và nhìn chung về tổng thể sao..?

 
GN⁺ 2025-12-03
Ý kiến trên Hacker News
  • Tuần trước, khách hàng gửi câu hỏi về một tính năng do tôi viết một phần. Kỹ sư hỗ trợ đã tạo câu trả lời bằng Claude, nhưng dù đã được học từ tài liệu nội bộ và công khai, nó vẫn rất tự tin tạo ra những lời bịa đặt nghe có vẻ hợp lý
    Trong lúc tôi giải thích vì sao nó sai, một kỹ sư khác thử chạy bằng Augment, và lần này nó lại tự tin đưa ra một kiểu nhảm nhí khác. Cuối cùng mọi người chỉ biết gửi emoji khóc cho nhau, còn tôi thì vẫn sẽ tiếp tục dùng trí thông minh tự thân của mình

    • Mã của tôi mất 0,11 giây, mã của Gemini mất 0,5 giây. Sếp hỏi lý do, mà tôi chẳng biết phải giải thích sao ¯\(ツ)
    • LLM thực sự rất yếu với những việc bất khả thi. Có lúc còn tốt hơn nếu tự triển khai luôn tính năng mà chúng bịa ra bằng ảo giác. Một số nhà cung cấp API công khai đã làm vậy rồi
  • Tôi nghe tin đồn rằng OpenAI đã không còn pre-training thành công nào kể từ giữa năm 2024. Nếu hỏi ChatGPT 5.1 về các sự kiện hiện tại mà không cho dùng internet, nó nói mốc cắt kiến thức là tháng 6/2024. Không rõ có phải vì đó là mô hình nhỏ hay không, nhưng ở thời điểm này thì chậm 18 tháng có vẻ là một tín hiệu đáng lo

    • Bản tin SemiAnalysis cũng nói điều tương tự, và chưa từng bị bác bỏ
    • Thỉnh thoảng tôi thử code bằng các mô hình GPT, và trong vài ngày đầu chúng có vẻ ổn nhờ phong cách hội thoại ngắn gọn. Nhưng rốt cuộc chất lượng vẫn kém hơn Claude hay Gemini, và kiểu thất bại cũng nhiều hơn
    • Tôi hỏi ChatGPT 5.1 về vấn đề cài đặt codex CLI, nó lại rất tự tin nói rằng codex đã bị khai tử và tôi dùng sai lệnh openai
    • Google cũng từng gặp vấn đề chậm crawl web vào đầu những năm 2000 mà vẫn sống sót. Chỉ là OpenAI hiện nay không có vị thế khác biệt như Google khi đó, nên tình hình có thể nguy hiểm hơn nhiều
    • Tôi hỏi nên chơi Indiana Jones trên PS5 hay PC, ban đầu nó tưởng tôi gõ sai, rồi cuối cùng lên mạng tìm và còn khen cả gaming rig của tôi
  • Có vẻ làn sóng các nhà nghiên cứu cốt lõi rời OpenAI kéo dài từ năm ngoái giờ mới bắt đầu tạo tác động thực sự. Sam Altman là người bán hàng chứ không phải nhà nghiên cứu. Ilya cũng không còn, các nhân sự chủ chốt thì đã sang Google, Meta, Anthropic hoặc tự lập công ty. Những người ở lại có thể giỏi cải tiến lặp lại, nhưng tôi nghi ngờ liệu họ có thể tự dẫn dắt bước nhảy vọt tiếp theo hay không

  • OpenAI hiện giờ giống như Netscape. Đổi mới thật đấy nhưng không có mô hình doanh thu bền vững. Một bên thì Google bundle AI miễn phí vào các sản phẩm sẵn có, bên kia thì DeepseekQwen kéo giá xuống bằng mã nguồn mở. Thành ra bị ép từ cả hai phía

    • Có tin OpenAI năm nay sẽ vượt 20 tỷ USD doanh thu thường niên (bài CNBC)
    • Nếu OpenAI thất bại trong thương mại hóa và quay lại mô hình phi lợi nhuận để chia sẻ công cụ miễn phí, thì chẳng khác nào đi theo con đường của Mozilla
    • Có người nói “Google sẽ bundle Gemini miễn phí”, nhưng chẳng phải họ gần như đã làm vậy với hầu hết sản phẩm rồi sao
    • Vợ tôi từ chối chuyển sang Claude. Cô ấy cảm thấy ChatGPT đã được tinh chỉnh hoàn hảo theo đúng gu của mình
    • Muốn bundle Gemini miễn phí thì chi phí suy luận của Flash 3.0 sẽ phải thấp hơn 2.5 rất nhiều mới được
  • Tôi thật sự tò mò. Làm sao mà OpenAI có thể thất bại ở pre-training được? Họ đã từng thành công, nhân lực cũng ở đẳng cấp cao nhất, chẳng phải cứ huấn luyện lại mô hình năm 2024 là được sao?

    • Vì cùng lý do mà ai cũng thất bại. Họ điều chỉnh hyperparameter cho phần cứng mới, áp dụng các cải tiến đọc được từ bài báo, nhưng rồi sau vài tháng và vài triệu đô la, loss bị phẳng và kết quả thu được rất ít
    • Nếu “thành công” có nghĩa là đạt hiệu năng tốt hơn thấy rõ so với mô hình trước, thì đó thực sự là chuyện rất khó
    • Tôi nghe nói GPT-4.5 chính là một nỗ lực như vậy. Chỉ là hiệu năng không đủ tốt nên không công bố
    • Mô hình mới không tiếp tục học nối từ mô hình cũ. Vì kiến trúc đã hoàn toàn khác. Lần này có khả năng thiết kế đó bị sai, khiến nó còn tệ hơn cả mô hình giữa năm 2024
  • Code Red” mà tôi từng trải qua thường chỉ là cách tô vẽ cho tình trạng cả công ty đang mất phương hướng. Tầng quản lý trung gian không biết phải làm gì, nên cuối cùng kỹ sư là người phải gánh hết

    • Sa thải PM và quản lý trung gian không phải là cách ngăn chuyện này xảy ra. Đó là cách nhìn quá đơn giản về cấu trúc ra quyết định trong các tổ chức lớn
    • Một Code Red đúng nghĩa phải hợp nhất ưu tiên của công ty và điều chuyển kỹ sư sang các dự án cốt lõi
    • Trong trường hợp duy nhất tôi từng thấy, công ty thật sự sa thải PM, rồi đủ loại vấn đề ngoài dự kiến nổ ra, và họ chấp nhận nó như kiểu “ít ra cũng tốt vì giờ ta đã biết vấn đề”
    • Cũng tồn tại ảo tưởng của kỹ sư rằng “mọi vấn đề đều do người khác, chỉ cần còn mình là giải quyết được hết”
    • Code Red lần này cũng có thể chỉ là cái cớ để dừng các tính năng kiếm tiền. Một động thái nhằm tránh khoảng cách với định giá doanh nghiệp thực tế
  • Code Red thực sự không phải là chuyện Google vượt OpenAI, mà là việc sự thật ngành AI không hề có hào lũy cạnh tranh đã lộ ra. Cuối cùng tất cả chỉ đang lao vào cuộc đua xuống đáy đắt đỏ nhất

    • Rồi những công ty kiểu này cuối cùng sẽ xã hội hóa thua lỗ thông qua hợp đồng chính phủ hoặc các gói cứu trợ gián tiếp
    • Chưa rõ hiệu năng của Gemini 3 có thực sự khiến người dùng ChatGPT rời bỏ hay không
    • Tôi không hiểu nổi vì sao nhà đầu tư lại hào hứng với cuộc cạnh tranh thương mại hóa một sản phẩm lỗ vốn như thế. Thời GPT-3~4 tôi cũng từng là fan, nhưng giờ thì dùng song song Claude và Gemini. Độ trung thành bằng 0
    • Nếu vậy thì tại sao cổ phiếu Google lại tăng mạnh sau khi phát hành Gemini 2.5 Pro?
    • Tôi cũng từng nghĩ OpenAI hẳn có kỹ thuật huấn luyện bí mật gì đó, nhưng hóa ra là không có
  • OpenAI đã cam kết chi tiêu dài hạn quy mô 500 tỷ USD thông qua dự án Stargate và các kế hoạch khác. Họ dự định chi 250 tỷ USD cho Microsoft Azure, cùng hàng tỷ USD cho GPU AMD. Oracle đã vay 18 tỷ USD trái phiếu9,6 tỷ USD khoản vay để phục vụ việc này
    Nếu OpenAI bị tụt lại phía sau, họ sẽ không thể gánh nổi những hợp đồng đó, và sẽ xuất hiện rủi ro vỡ nợ dây chuyền. Chính phủ cũng có thể phải can thiệp

    • Altman nói sẽ không có cứu trợ, nhưng chính câu nói đó là một chiến lược tạo niềm tin
    • 500 tỷ USD là cam kết chi tiêu, không phải doanh thu. Khác biệt rất lớn
    • Thà hy vọng bế tắc ở Quốc hội sẽ chặn được các gói cứu trợ kiểu này còn hơn
    • Phần lớn chỉ là LOI không ràng buộc, nên không phải những cam kết chắc chắn như vẻ ngoài
    • Với kiến trúc LLM hiện tại, có thể không thể đạt AGI. Nếu không phát triển được cấu trúc thay thế, toàn bộ các hợp đồng này sẽ trở nên vô nghĩa
  • Nghe nói OpenAI đang hoãn các dự án như quảng cáo, mua sắm, health agent, Pulse để tập trung cải thiện ChatGPT, nhưng về cơ bản thì nhân lực cốt lõi là thiểu số, còn những người khác hoàn toàn có thể làm quảng cáo hay các tính năng thương mại. Hai việc đó không nhất thiết xung đột

    • Nút thắt không phải là nhân lực mà là dung lượng tư duy chiến lược của lãnh đạo
    • Vấn đề có thể không nằm ở chất lượng sản phẩm mà ở năng lực xây dựng hệ sinh thái. Google đã được tích hợp sẵn vào các công cụ hằng ngày
    • Tiến bộ của LLM chia làm hai tầng: ① kiến trúc tầng thấp ② hệ thống ứng dụng và kiểm chứng. Tầng sau đóng góp vào việc cải thiện mô hình cốt lõi thông qua tạo dữ liệu kiểm chứng tự động
    • “Trì hoãn” có thể không phải dừng hẳn mà chỉ là phân bổ lại tài nguyên tính toán
    • Từ góc nhìn người dùng, chỉ mong cuộc cạnh tranh này sẽ dẫn đến chất lượng mô hình tốt hơn
  • Theo WSJ, OpenAI đang hoãn quảng cáo, AI cho y tế và mua sắm, cùng trợ lý cá nhân Pulse. Cộng thêm cả việc hợp tác phần cứng với Jony Ive, cảm giác như sự tập trung đang bị phân tán

    • Ngoài ra họ còn từng công bố các dự án như mạng xã hội hay trình duyệt
    • Nếu muốn cạnh tranh với Google thì bước vào thị trường quảng cáo là quan trọng nhất. Nếu không, ngân sách quảng cáo sẽ chảy về Meta, Amazon và Google
    • Cuối cùng thì quảng cáo và trợ lý kiểu Siri/Alexa mới là cốt lõi, nên việc hoãn chúng nghe khá lạ
    • Không chỉ đơn thuần là mất tập trung, mà giờ họ đã trở thành một công ty chạy theo kết quả ngắn hạn. Rất khó thắng Google, đối thủ đã chơi trò đó suốt 25 năm. Chỉ mở rộng phần cứng thì cũng có giới hạn
    • Thực ra đây không phải câu chuyện cạnh tranh với Google, mà là việc quảng cáo chính là bài kiểm tra sống còn của OpenAI.
      Nếu quảng cáo kiếm được tiền, OpenAI sẽ trở thành một công ty cỡ Mag 7, còn nếu thất bại thì thực tế sẽ lộ ra.
      Nếu kết quả thử nghiệm quảng cáo đã dưới kỳ vọng, thì “Code Red” có thể chỉ là tín hiệu câu giờ để che đi điều đó.
      ChatGPT không phải điểm vào của tìm kiếm như Google, cũng không thể làm quảng cáo dựa trên feed như Meta.
      Cuối cùng rất có thể họ sẽ lặp lại thất bại của Alexa.