1 điểm bởi GN⁺ 2025-06-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • OpenAI đã giảm 80% giá của mô hình o3
  • Đợt giảm giá này giúp startup và ngành IT giảm đáng kể gánh nặng chi phí khi sử dụng o3
  • Mang đến lựa chọn kinh tế hơn cho các nhà phát triển dịch vụ AI
  • Kỳ vọng sẽ thúc đẩy cạnh tranh thị trường và tạo môi trường thuận lợi cho việc triển khai AI nhanh hơn
  • Việc sử dụng mô hình được đẩy mạnh, qua đó được dự báo sẽ tăng tốc mở rộng hệ sinh thái

Tin tức OpenAI giảm 80% giá o3

  • OpenAI đã công bố chính sách giảm 80% giá của mô hình o3 so với trước đây
  • Nhờ đó, startup, doanh nghiệp vừa và nhỏ, cùng các nhà phát triển cá nhân sẽ có thể sử dụng API của mô hình o3 với chi phí thấp hơn nhiều
  • Khi rào cản gia nhập trong việc ứng dụng AI giảm xuống, khả năng phát triển nhiều ứng dụng AI và dịch vụ đa dạng sẽ tăng lên
  • Chính sách giá lần này sẽ thúc đẩy cạnh tranh trong thị trường AI và góp phần tạo ra môi trường có lợi cho sự lan tỏa công nghệ nhanh chóng
  • Trong tương lai, hiệu quả tiết kiệm chi phí trong việc tối ưu hóa thuật toán deep learning và phát triển các dịch vụ AI quy mô lớn được kỳ vọng sẽ tiếp tục thúc đẩy đổi mới

1 bình luận

 
GN⁺ 2025-06-11
Ý kiến trên Hacker News
  • Tôi muốn chia sẻ một điểm cần lưu ý dựa trên trải nghiệm của mình. Tôi đã có sẵn credit trên OpenRouter nên định bật o3 lên dùng, nhưng lại nhận được thông báo rằng "OpenAI yêu cầu phải cung cấp API key trực tiếp để dùng o3 API". Vì vậy tôi đã mua 20 USD credit API bằng tài khoản OpenAI, khởi động Aider với API key mới và model o3. Khi gửi request, tôi gặp lỗi nói rằng "tổ chức phải được xác minh thì mới dùng được o3; để xác minh tổ chức, hãy nhấp vào Verify Organization trong liên kết". Tôi bắt đầu thấy rất bực, quay lại OpenAI và nhấn Verify Organization thì mới phát hiện thực chất là phải xác minh danh tính của mình với bên thứ ba tên Persona. Khi nhấn "Start ID Check", hiện ra thông báo rằng Persona sẽ thu thập và sử dụng thông tin cá nhân cùng dữ liệu sinh trắc học của tôi, và dữ liệu đó sẽ được lưu giữ trong 1 năm. Chỉ vì muốn chi vài đô cho quyền truy cập API mà bỗng nhiên lại bị yêu cầu cung cấp dữ liệu sinh trắc học của mình cho công ty AI lớn nhất thế giới và đối tác của họ. Tôi cũng không biết phải xin hoàn tiền thế nào
    • Tôi cũng từng không được hoàn tiền từ một công ty AI khác, nên đã phải liên hệ với văn phòng Tổng chưởng lý bang California để giải quyết hoàn tiền. Tôi nghĩ chúng ta cần chấn chỉnh kiểu bổ sung yêu cầu sau khi đã thanh toán như thế này. Ngoài ra, họ đã có tên, địa chỉ và thông tin thẻ của tôi dưới dạng dữ liệu cá nhân rồi, nên tôi không hiểu vì sao còn yêu cầu cả số điện thoại nữa. Có ai biết vì sao họ lấy số điện thoại của tất cả mọi người không?
    • Tôi tự hỏi có phải Sam Altman thực ra cũng đang vận hành một công ty tiền mã hóa thu thập dữ liệu sinh trắc học để xác minh danh tính hay không (Worldcoin). Nghe quen quen quá Thông tin về Worldcoin
    • Tôi có cảm giác như đã thấy gần như đúng câu chuyện này trong vòng một tháng trở lại đây, nên hoặc là tôi bị déjà vu, hoặc là còn điều gì đó khác ở đây
    • Thật ra tôi nghĩ bạn còn may mắn vì ít nhất vẫn có thể thử xác minh danh tính. Tôi thì chỉ gặp lỗi "session expired" suốt mấy tháng nay và đội hỗ trợ cũng chẳng trả lời
    • Tình huống này xảy ra đúng lúc với việc bị yêu cầu KYC (xác minh danh tính khách hàng) và OpenAI lưu lại toàn bộ log
  • Dạo này tôi cảm thấy OpenAI đã trở nên "lười" hơn. Tôi đặt câu hỏi thì họ không đưa toàn bộ file hay phần chỉnh sửa trực tiếp, mà chỉ nói "nên làm thế này"; phải yêu cầu thêm 2–3 lần nữa thì họ mới thực sự làm. Tôi không thấy hiện tượng này ở deepseek. Không biết có phải họ trả lời kiểu đó để tiết kiệm tài nguyên không
    • Tôi là nhân viên OpenAI. Model của chúng tôi đôi lúc có thể hơi lười. Đó không phải là chủ đích, và chúng tôi sẽ tiếp tục cung cấp các model tốt hơn về sau. Khi tôi còn làm ở Netflix cũng từng có nghi ngờ tương tự, rằng chúng tôi cố tình đưa ra gợi ý chất lượng thấp, nhưng thực tế là việc nâng độ hoàn thiện của sản phẩm không hề dễ. Rốt cuộc, làm ra một sản phẩm hoàn hảo là chuyện cực kỳ khó
    • Gần đây tôi yêu cầu kiểu "hãy vẽ biểu đồ X so với Y" cho một phép tính hóa học, thì nó chỉ trả lời dài dòng toàn phần giải thích rồi kết thúc bằng "nếu cần biểu đồ thì cứ nói nhé!". Hơi buồn cười
  • Tôi thắc mắc làm sao chúng ta biết được model o3 không phải là bản quantized (giảm độ chính xác). Tôi nghĩ các công ty có thể công bố benchmark rất đẹp rồi dần dần quantize model (từ Q8 xuống Q6, Q4, v.v.) khiến hiệu năng giảm đi. Tôi nghi gpt-4-turbo được tung ra nhanh cũng là nhờ cách này. Dùng thực tế thì nó kém hơn GPT-4 gốc, và có lẽ họ chỉ tập trung benchmark cho turbo và 4o. Người dùng thì lại cảm nhận như nó tốt hơn dù thực tế không phải vậy
    • Có lẽ đây đúng là cách mà các công ty đang làm, và tôi nghĩ họ đã đổi thương hiệu o3 gốc thành o3-pro
    • Lúc nào cũng thấy model mới ban đầu thì rất tốt rồi dần dần kết quả kém đi. Trước đây tôi tưởng là họ cố loại bỏ đầu ra tệ bằng fine-tuning nên hiệu năng mới bị kéo xuống, nhưng giờ tôi lại nghi là do quantizing
    • Tôi làm ở OpenAI, model vẫn là cùng một model và chúng tôi không dùng quantizing hay mánh khóe gì cả. Chúng tôi tuyệt đối không âm thầm thay model cho nhà phát triển trên API mà không báo trước. Trên ChatGPT thì việc liên tục hiển thị số phiên bản cho người dùng khá bất tiện nên cập nhật có thể kém rõ ràng hơn một chút, nhưng cũng không phải kiểu thay đổi hoàn toàn trong im lặng. Tất cả cập nhật model đều được công bố tại ChatGPT Release Notes. Chỉ có con trỏ chatgpt-4o-latest là ngoại lệ duy nhất, có thể thay đổi mà không báo trước
    • Trong email công bố chính thức có giải thích rằng "OpenAI đã giảm 80% giá o3 xuống còn 2 USD cho 1 triệu token đầu vào và 8 USD cho 1 triệu token đầu ra, đồng thời chỉ tối ưu hóa inference stack nên vẫn là cùng một model nhưng rẻ hơn"
    • Ngay sau thông báo, tôi thấy o3 đạt tốc độ hơn 700 token mỗi giây nên thật sự nghi ngờ đây có phải bản quantized hay không liên kết liên quan
  • Tôi thắc mắc liệu hạn mức tin nhắn hằng tuần cho o3 của người dùng ChatGPT Plus có được tăng theo không. Theo trải nghiệm thực tế của tôi, o4-mini và o4-mini-high kém o3 khá xa về mức độ hữu ích, nhưng vì o3 bị giới hạn tốc độ nên rốt cuộc tôi chủ yếu vẫn phải dùng dòng o4-mini. Cấu trúc này càng làm mạnh thêm ấn tượng rằng "model tư duy" của OpenAI đang tụt lại so với đối thủ
    • Tôi cũng từng gặp giới hạn tốc độ khá nặng với o3, còn o4-mini-high thì tôi thấy khá tốt, nhưng đúng là tôi muốn dùng o3 nhiều hơn hẳn. Hy vọng thông báo này cũng đi kèm việc tăng hạn mức
  • Google cũng đang bắt kịp rất nhanh ở mảng AI. Mới vài tháng trước thôi DeepSeek còn là tâm điểm, đúng là lĩnh vực này đang tiến hóa cực nhanh
    • Trong nhận thức của nhiều người, model Gemini của Google hiện là SOTA (State Of The Art, hiệu năng tốt nhất), còn với các tác vụ lập trình thì Claude cũng được đánh giá khá cao
    • Mấy tháng gần đây tôi chỉ dùng model của Google, vì giờ ChatGPT trở nên quá mềm mỏng và thiếu thực chất. Không chỉ ở đầu hay cuối mà ngay giữa câu trả lời cũng có rất nhiều lời xã giao, trong khi thông tin thực tế thì ít. Nếu yêu cầu đổi phong cách thì nó lại có xu hướng lạm dụng thuật ngữ kỹ thuật
    • Lý do mọi người từng kỳ vọng vào Deepseek là vì có thể tự tải model về trực tiếp. Nhưng kể từ Gemini 2.5 thì có vẻ nó vẫn chưa vượt ra khỏi vị trí hạng ba bao nhiêu
  • Tôi không hiểu vì sao OpenAI lại yêu cầu xác minh "tổ chức" (đòi giấy tờ tùy thân do chính quyền cấp) để được dùng o3
    • Tôi muốn khuyên là đừng nên thử làm gì. Rất nhiều người đã thất bại ở quy trình xác minh và dường như cũng không có cơ hội thứ hai ví dụ 1 ví dụ 2 ví dụ 3 ví dụ 4 ví dụ 5 ví dụ 6 ví dụ 7
    • Tôi cũng nghĩ có thể mục đích là để ngăn Deepseek R2 được huấn luyện trên model của OpenAI
  • Trái với nhận định rằng LLM không có lợi thế cạnh tranh bền vững và chỉ đang đốt cache, tôi cho rằng tình hình của OpenAI thực ra rất đáng khích lệ. Họ công bố doanh thu quy đổi theo năm đạt 10 tỷ USD, và trong vòng gọi vốn hồi tháng 3, định giá đã lên đến 300 tỷ USD. Dù lỗ 5 tỷ USD, họ vẫn đang ghi nhận tăng trưởng doanh thu gấp 30 lần và có hơn 500 triệu người dùng hoạt động. Đà tăng trưởng này khiến tôi nhớ đến Uber thời kỳ đầu với tốc độ tăng trưởng nhanh, nhận vốn lớn, rồi dần tiến tới khả năng sinh lời
    • Vấn đề là doanh thu tăng thì chi phí cũng tăng theo. Thông thường khi mở rộng quy mô thì đơn giá giảm xuống, nhưng với OpenAI, càng nhiều lượt dùng thì chi phí tính toán cũng tăng tương ứng. Nếu không có thêm nguồn doanh thu phụ trợ thì hiệu ứng kinh tế theo quy mô khá yếu. Netflix cũng là một ví dụ tương tự. Tôi nghĩ sẽ rất khó đạt được lợi nhuận bền vững
    • Xét theo cảm nhận thì nhờ lợi thế đi trước, OpenAI khiến tôi vẫn duy trì gói trả phí hằng tháng và cũng không có nhu cầu phải liên tục đổi qua lại giữa nhiều lựa chọn. Sau này khi thị trường ổn định hơn và cạnh tranh giá mạnh hơn, tôi sẵn sàng chuyển sang dịch vụ khác. Cuối cùng, độ bền của lợi thế đi trước còn tùy vào việc nguồn doanh thu chính là người dùng ứng dụng hay gói API. Ngoài độ tin cậy và tên tuổi thương hiệu, tôi thấy những người xung quanh cũng đang khá linh hoạt trong việc chọn các phương án thay thế phù hợp
    • Xét đến việc giá LLM rồi sẽ mãi đi xuống và cuối cùng chỉ các model miễn phí tồn tại, lợi thế cạnh tranh của OpenAI là khá mong manh. Tôi cũng cho rằng riêng "model biết suy nghĩ" thì không thể giải quyết được các vấn đề phức tạp, và phần nào đã bị đánh giá quá cao
    • Tôi không đồng ý với lập luận "không có lợi thế cạnh tranh". Dữ liệu tương tác của người dùng như dữ liệu chat tự nó đã rất có giá trị
    • Nếu chỉ nhìn vào tăng trưởng của OpenAI thì đúng là đáng khích lệ, nhưng nếu tính cả tác động xã hội của các công ty AI như ChatGPT thì tôi không thấy bức tranh sáng sủa đến vậy. Ví dụ, nội dung AI vô nghĩa đang bị đổ ồ ạt lên các cửa hàng trực tuyến, làm trải nghiệm mua sắm đi xuống. Trong một số nhóm quá sa đà vào ChatGPT, người ta còn lệch lạc trong giao tiếp với bạn bè và gia đình ngoài đời, thậm chí dẫn đến ly hôn. Trong giáo dục cũng đang có rất nhiều hỗn loạn do lạm dụng. Giống như sự tăng trưởng của Uber, thành công của OpenAI không nhất thiết chỉ mang lại tác động tích cực cho xã hội
  • Model o3 hiện là một trong những model tốt nhất, mà giá còn ngang hoặc rẻ hơn Claude và Gemini. Cảm giác như họ không cho đối thủ có lấy chút thời gian để thở
    • Gemini cũng ở mức tương đương, thậm chí đôi khi còn tốt hơn, nên chọn nó cũng rất hợp lý. o3-pro có thể còn nhỉnh hơn một bậc
  • Nếu ngày xưa phải mất hàng chục năm để chất lượng tìm kiếm của Google trở nên tệ đi, thì giờ đây chúng ta đang sống trong một thời đại kỳ lạ khi chất lượng model AI có thể xuống cấp chỉ trong vài ngày
  • Có lẽ việc ra mắt o3-pro cũng liên quan đến lý do đó