Gói thuê bao AI là quả bom hẹn giờ của doanh nghiệp

(thestateofbrand.com)

7 điểm bởi GN⁺ 2026-05-18 | 7 bình luận | Chia sẻ qua WhatsApp

OpenAI, Anthropic, Google và các công ty khác đang đưa ra mức giá thuê bao thấp hơn chi phí cung cấp thực tế cho doanh nghiệp, điều này có thể tạo ra cú sốc chi phí lớn khi giá được điều chỉnh
Mức phí cố định 20 USD/tháng của Claude Pro·ChatGPT Plus có thể tương đương chi phí API thực tế lên tới 200~400 USD mỗi ghế/tháng đối với người dùng cường độ cao
AI dạng tác nhân làm tăng mạnh mức tiêu thụ token do tự vận hành trong thời gian dài, và GitHub Copilot cũng sẽ chuyển sang tính phí theo mức sử dụng vào tháng 6/2026
Chi phí thuê bao 1.000 USD/tháng của một đội 50 người có thể tương đương 15.000~40.000 USD/tháng nếu tính theo lượng token thực tế, làm tăng đáng kể mức độ phơi bày ngân sách
Việc OpenAI và Anthropic chuẩn bị IPO làm gia tăng áp lực về biên lợi nhuận và hiệu quả kinh tế theo đơn vị, có thể đẩy nhanh việc tăng giá, giới hạn mức sử dụng và chuyển sang mô hình tính phí theo tiêu dùng

Khoảng cách giữa giá thuê bao AI và chi phí thực tế

Các nhà cung cấp AI lớn như OpenAI, Anthropic, Google đang cung cấp dịch vụ cho khách hàng doanh nghiệp với mức giá thuê bao thấp hơn chi phí cung cấp thực tế, và nếu doanh nghiệp xem mức giá này là chuẩn vĩnh viễn để xây dựng quy trình làm việc thì có thể chịu cú sốc chi phí lớn khi giá được điều chỉnh trong tương lai
Claude Pro với giá 20 USD/tháng cung cấp Sonnet 4.6, Opus 4.6, tìm kiếm web, thực thi mã, tạo tệp và mức sử dụng cao gấp khoảng 5 lần so với gói miễn phí
Theo API, Sonnet 4.6 có giá 3 USD cho mỗi 1 triệu token đầu vào và 15 USD cho mỗi 1 triệu token đầu ra, còn Opus 4.6 có giá 5 USD cho mỗi 1 triệu token đầu vào và 25 USD cho mỗi 1 triệu token đầu ra
Nếu một nhân sự tri thức dùng Claude vài giờ mỗi ngày để tải tài liệu lên, viết báo cáo và phân tích dữ liệu, họ có thể dùng đến hàng triệu token mỗi tuần; nếu quy đổi theo phí API thì mức này có thể tăng lên khoảng 200~400 USD mỗi ghế/tháng
Microsoft được cho là đã lỗ hơn 20 USD mỗi người dùng/tháng với GitHub Copilot, và chi phí compute cho người dùng cường độ cao của gói 10 USD/tháng đã tăng tới 80 USD
Cũng có phân tích cho rằng người dùng Anthropic đã tiêu thụ hơn 8 USD compute cho mỗi 1 USD doanh thu thuê bao, còn Nick Turley, VP phụ trách sản phẩm tại OpenAI, mô tả giá thuê bao hiện tại là một cấu trúc được hình thành mang tính ngẫu nhiên và ví khả năng loại bỏ dần gói không giới hạn với việc dùng điện không giới hạn
ChatGPT Plus đã giữ mức 20 USD/tháng trong 3 năm, nhưng trong thời gian đó đã bổ sung thêm các tính năng như tạo ảnh, diễn giải mã, chế độ giọng nói, suy luận dạng tác nhân và tìm kiếm web

Chiến lược giá chung của các nhà cung cấp lớn

Google gộp Gemini Advanced vào gói Google One AI Premium giá 20 USD/tháng, trong khi vẫn tính phí riêng cho quyền truy cập API của cùng mô hình đó
Meta cung cấp Llama miễn phí và trợ giá chi phí compute cho hàng trăm triệu truy vấn AI phát sinh trên nền tảng của mình bằng doanh thu quảng cáo
Grok của xAI đặt giá API đầu vào thấp ở mức 0,20 USD cho mỗi 1 triệu token, và được xem là mô hình chấp nhận lỗ để giành thị phần
Mẫu số chung là định giá theo hướng mở rộng triển khai hơn là tối ưu kinh tế, khóa tổ chức vào hệ sinh thái, biến AI thành yếu tố phụ thuộc cốt lõi trong công việc hằng ngày của từng nhóm, rồi để bài toán chi phí lại phía sau
OpenAI đang thua lỗ ở mảng thuê bao người tiêu dùng và được cho là đang xem xét chuyển trọng tâm chiến lược nhiều hơn sang khối doanh nghiệp, nơi hiệu quả kinh tế theo đơn vị bớt tệ hơn
Theo The Wall Street Journal, trong quá trình hướng tới IPO, OpenAI đã không đạt các mục tiêu doanh thu và người dùng chủ chốt, và mô hình định giá dựa trên trợ giá cũng đang bắt đầu rạn nứt

AI dạng tác nhân làm xấu đi cấu trúc chi phí

Nếu việc dùng chatbot tạo ra mức tiêu thụ token tương đối dễ dự đoán giữa câu hỏi và câu trả lời, thì AI dạng tác nhân lại làm tăng mạnh mức sử dụng token nhờ khả năng tự vận hành trong thời gian dài
Các phiên Claude Code có thể chạy tự động trong thời gian dài và tiêu thụ token với tốc độ cao hơn nhiều so với cách dùng mang tính hội thoại
Một số người dùng cho biết họ đã dùng hết cửa sổ giới hạn tốc độ 5 giờ chỉ trong 90 phút
GitHub đã công bố sẽ chuyển Copilot sang tính phí theo mức sử dụng từ ngày 1/6/2026 vì mô hình giá cố định đã sụp đổ trước khối lượng công việc dạng tác nhân
GitHub cho biết Copilot đã tiến hóa mạnh và việc sử dụng dạng tác nhân "đang trở thành mặc định", kéo theo nhu cầu compute và suy luận ngày càng lớn
Sam Altman đã công khai nói rằng OpenAI giờ phải trở thành một công ty suy luận AI, điều này phù hợp với bối cảnh rằng việc sử dụng dạng tác nhân đòi hỏi một mô hình kinh tế căn bản khác
Trong các nhóm kỹ thuật, Agent Teams với nhiều phiên bản AI xử lý song song một dự án có thể làm chi phí tăng vọt; nếu lập trình viên chạy đồng thời 3~4 tác nhân lập trình thì lượng token tiêu thụ có thể không chỉ tăng vài lần mà còn vượt lên mức một chữ số so với trò chuyện đơn thuần

Mức độ phơi bày chi phí mà doanh nghiệp chưa đo lường

Trong 2 năm qua, nhiều doanh nghiệp đã tích hợp thuê bao AI sâu vào vận hành, với bộ phận marketing dùng ChatGPT Plus để viết nội dung, kỹ thuật dùng Claude Pro để viết và review mã, còn các nhóm nghiên cứu, customer success và tài chính cũng dùng AI để tóm tắt tài liệu, tóm tắt ticket và mô hình hóa kịch bản
Nếu 50 người dùng Claude Pro, chi phí hiện tại là 1.000 USD/tháng; ChatGPT Plus cũng ở mức tương tự, khiến AI trông như một khoản mục nhỏ trên báo cáo lãi lỗ
Nhưng nếu tính mức sử dụng API thực tế của cùng đội ngũ đó dựa trên lượng token tiêu thụ, chi phí có thể lên tới 15.000~40.000 USD/tháng tùy cường độ sử dụng, biến nó thành một hạng mục cần mã ngân sách riêng
Khi giá được điều chỉnh, những doanh nghiệp từng xem AI 20 USD/tháng là một đầu vào rẻ vĩnh viễn có thể nhận các hóa đơn ngoài ngân sách vào thời điểm AI đã ăn sâu vào quy trình làm việc và rất khó loại bỏ
Trợ giá tạo ra sự phụ thuộc, và sự phụ thuộc trở thành cái bẫy khiến doanh nghiệp khó tránh khỏi việc tăng giá
KPMG Q1 2026 AI Quarterly Pulse cho biết các tổ chức tại Mỹ dự kiến chi trung bình 207 triệu USD cho AI trong 12 tháng tới, gần gấp đôi cùng kỳ năm trước
Theo khảo sát nghiên cứu của Goldman Sachs, nhiều tập đoàn lớn đã vượt ngân sách AI ở mức nhiều chữ số, và chi tiêu cho AI trong tương lai gần có thể ngang với lương kỹ sư
Swami Chandrasekaran, lãnh đạo AI và data lab của KPMG North America, nói với Marketplace rằng chỉ một hoặc hai quý trước thôi, hầu như chưa ai quan tâm đến chi phí tiêu thụ LLM
Brian Jabarian, nhà kinh tế học tại University of Chicago, khi tư vấn chuyển đổi AI cho doanh nghiệp đã nói rằng đã gần đến lúc hóa đơn kéo tới

IPO có thể buộc phải tái điều chỉnh giá

OpenAI và Anthropic đang chuẩn bị IPO, và trong quá trình này áp lực thu hẹp khoảng cách giữa giá thuê bao và chi phí thực tế có thể tăng mạnh
Anthropic được cho là đã vượt 30 tỷ USD doanh thu thường niên hóa, tăng từ 9 tỷ USD vào cuối năm 2025
OpenAI được đề cập là đang đạt tốc độ doanh thu khoảng 25 tỷ USD
OpenAI được cho là dự kiến đốt tiền lũy kế 115 tỷ USD vào năm 2029 và đã cam kết 665 tỷ USD chi tiêu compute đến năm 2030
Oracle được cho là đã gánh 43 tỷ USD nợ trong một năm tài chính để xây dựng trung tâm dữ liệu cho OpenAI
Khi còn là công ty tư nhân đốt vốn đầu tư mạo hiểm, họ có thể trợ giá chi phí suy luận, vận hành mô hình trong thua lỗ và duy trì gói 20 USD/tháng có chi phí cung cấp vượt 100 USD
Sau IPO, thị trường đại chúng sẽ đòi hỏi biên lợi nhuận, các nhà phân tích sẽ yêu cầu hiệu quả kinh tế theo đơn vị, và nhà đầu tư sẽ muốn thấy con đường lợi nhuận không dựa vào việc huy động vốn vô hạn
Các cách nhanh nhất để thu hẹp khoảng chênh giá là tăng giá, giới hạn mức sử dụng và chuyển sang tính phí theo tiêu dùng; cả ba đều có thể ảnh hưởng lớn đến các thuê bao doanh nghiệp hiện nay

Những tín hiệu tái điều chỉnh giá đã xuất hiện

GitHub sẽ chuyển sang tính phí theo mức sử dụng từ ngày 1/6/2026, thay các yêu cầu premium giá cố định bằng AI Credits dựa trên token
Microsoft đã tăng giá Microsoft 365 hai lần trong 4 năm, và đợt tăng gần đây nhất gắn trực tiếp với chi phí hạ tầng AI
OpenAI đã giới thiệu gói Pro 100 USD như một mức giá thực tế mới dành cho người dùng cường độ cao
Gói Max 200 USD/tháng của Anthropic là một ví dụ cho thấy khi trợ giá kết thúc, mức sử dụng được đảm bảo thực chất có thể tốn kém đến đâu
Geoff Webb, VP của Conga, nói rằng quy mô của cuộc đua giành vị trí dẫn đầu trên thị trường AI là cực lớn, chi phí để thống trị nó cũng cực lớn, vì vậy rất có thể sẽ nhanh chóng diễn ra những thay đổi lớn về mô hình kinh doanh và giá dịch vụ trong quá trình kiếm tiền từ dịch vụ và thu hồi đầu tư

Điều lãnh đạo doanh nghiệp cần làm ngay

Doanh nghiệp cần kiểm toán lượng token tiêu thụ thực tế theo từng nhóm thay vì chỉ đếm số ghế
Cần mô hình hóa chi phí AI sẽ thay đổi ra sao trong các kịch bản chi phí tăng 2 lần, 5 lần, 10 lần so với hiện tại
Cần tạo quyền chọn nhà cung cấp trong stack để thay đổi giá từ một nhà cung cấp duy nhất không khiến ngân sách sụp đổ đột ngột
Cần trao đổi với CFO về khoảng cách chi phí AI trước khi CFO là người nêu vấn đề trước
Chênh lệch giữa số tiền tổ chức đang trả cho AI hiện tại và số tiền sẽ phải trả sau 18 tháng có thể trở thành một trong những khoản tăng chi phí lớn nhất mà nhiều doanh nghiệp phải hấp thụ
Có thể sẽ xuất hiện những doanh nghiệp phải giải thích vì sao một công cụ từng rẻ hơn cả bữa trưa của nhóm nay đột nhiên đòi hỏi ngân sách sáu chữ số mỗi năm
Kỷ nguyên trợ giá đang dần khép lại, nhưng nhiều doanh nghiệp vẫn chưa bắt đầu cuộc thảo luận này

7 bình luận

hmmhmmhm 2026-05-18

Có vẻ đây cũng là cùng một vấn đề như thời mainframe..
Nếu hình thành cục diện rằng máy chủ đắt đỏ và tài nguyên khan hiếm, còn máy tính cá nhân thì chậm
thì cuối cùng máy chủ cũng sẽ rẻ đi, máy tính cá nhân cũng sẽ mạnh hơn... Có lẽ thời gian sẽ là câu trả lời.

GN⁺ 2026-05-18

Ý kiến Hacker News

Mọi gói đăng ký AI đều giống như bom hẹn giờ đối với các nhà cung cấp mô hình frontier
Trong vài năm nữa, người ta sẽ có thể chạy các mô hình cục bộ tốt gần bằng các mô hình frontier hiện nay với chi phí gần như không đáng kể, và nền tảng thị trường doanh nghiệp của các công ty frontier sẽ sụp đổ
- Không rõ cơ sở nào cho nhận định “trong vài năm nữa sẽ chạy được các mô hình cục bộ tốt bằng mô hình frontier hiện nay”
  Chỉ riêng yêu cầu bộ nhớ đã là khổng lồ, và trong một thời gian nữa, dùng phần cứng lưu trữ chuyên dụng dùng chung với mức sử dụng cao vẫn sẽ hiệu quả chi phí hơn rất nhiều
- Nói cách khác, các mô hình frontier là tài sản mất giá rất nhanh vì cạnh tranh thị trường
  Chúng phải liên tục tốt hơn để vượt lên nhau và vượt cả mô hình trọng số mở, nên thực ra gần như là điều ngược lại với bom hẹn giờ
  Token suy luận ở mức chất lượng hiện tại sẽ tiếp tục rẻ đi, và dù chưa rõ cục bộ có phải trạng thái cuối cùng hay không vì yêu cầu phần cứng cao, cạnh tranh có xu hướng đẩy biên lợi nhuận về gần 0
  Thảo luận dài về chủ đề này: https://corecursive.com/the-pre-training-wall-and-the-treadm...
- Trong tháng vừa qua tôi đã gắn Qwen, Gemma, Deepseek phía sau LiteLLM để làm một demo nhỏ cho thấy tương lai có thể trông như thế nào
  Tôi đang theo dõi mức dùng token và chủ động tìm cách hạ chi phí suy luận, nội bộ hóa thay vì cứ dùng token một cách thô bạo
  Sếp tôi rất hài lòng và giờ đang triển khai rộng hơn. Tôi nghĩ đó là tương lai
- Rất đáng nghi khi nói rằng vài năm nữa sẽ chạy được mô hình cục bộ tốt bằng các mô hình frontier hiện nay
  Định luật mở rộng cũng đã bắt đầu trở nên nặng gánh, và không nên bị cuốn theo sự cường điệu về “tăng trưởng theo hàm mũ”
  Hơn nữa, đối thủ cạnh tranh thực sự là các mô hình frontier của 2 năm sau
- Nếu không có đột phá quan trọng trong sản xuất phần cứng hay kiến trúc mô hình thì thực ra là ngược lại
  So với 1~2 năm trước, giờ cần phần cứng lớn hơn, đắt hơn và ngốn nhiều năng lượng hơn
Tôi quá mệt với giọng điệu cường điệu trong các bài viết từ cả hai phe AI
Tôi muốn đứng trước bảng trắng với ai đó thực sự hiểu kinh tế học và mô hình kinh doanh của các nhà cung cấp token, rồi hỏi theo kiểu “giải thích như cho trẻ 5 tuổi”
Liệu với nhà cung cấp token thì đây là trò chơi biên lợi nhuận, còn với người tiêu dùng là trò chơi về chất lượng dịch vụ/sản phẩm; nếu đường chất lượng và biên lợi nhuận có lúc giao nhau thì có phải đây là cuộc đua chạm tới điểm đó trước khi hết tiền; và nếu vậy thì trong lịch sử có ví dụ nào mà khoảng cách giữa hai bên từng lớn đến thế không?
LLM có vẻ đặc biệt ở chỗ gần như không có giới hạn cho mức người dùng “mong nó tốt hơn đến đâu”, và nó không giống những dịch vụ dễ mở rộng về mặt tài nguyên tính toán như email
Đây là câu hỏi rất sơ cấp, nhưng tôi cũng thắc mắc vì sao người ta lại muốn IPO trước khi có mô hình kinh doanh bền vững. Lợi ích là gì?
- Tôi hỏi AI về chi phí sản xuất token Opus, và nó trả lời là 0,216 USD cho mỗi 1 triệu token, bao gồm phần cứng, điện, làm mát và lưu trữ
  Theo các liên kết được đăng ở đây, khoảng 30% chi tiêu của Anthropic là cho suy luận, còn 70% còn lại là R&D như phát triển mô hình kế tiếp
  Nếu phản ánh điều đó rồi cộng thêm lợi nhuận và đơn giản hóa con số, thì để kiếm tiền chỉ cần bán ở mức khoảng 1 USD cho mỗi 1 triệu token
  Giá API hiện tại là 25 USD cho mỗi 1 triệu token, nên tôi không nghi ngờ gì về khả năng sinh lời
  Ngược lại, nếu dùng cực hạn gói Max 200 USD/tháng thì có thể lên tới 10 tỷ token/tháng, tức chỉ còn 0,02 USD cho mỗi 1 triệu token, nghĩa là đang gánh khoản lỗ khổng lồ và kiểu đó sớm muộn cũng biến mất
  Tuy nhiên, nếu ai đó dùng khoảng 100 triệu token/tháng với gói Anthropic 100 USD/tháng thì công ty vẫn đang có lãi
  Để dùng tới 10 tỷ token/tháng thì phải làm việc rất lâu và cực kỳ giỏi tận dụng AI, mà kiểu người như vậy nhiều khả năng đã dùng AI suốt vài năm và đã thấy hữu ích ngay cả trước thời Opus
  Họ sẽ thất vọng nếu mất Opus, nhưng chính kiểu người dùng đó cũng là người có thể tận dụng tốt các mô hình yếu hơn, nên vài năm nữa họ có thể chuyển sang mô hình mã nguồn mở tự host nội bộ mà vẫn đạt mức tương đương 0,02 USD cho mỗi 1 triệu token như hiện nay
  Vì vậy tôi không bị thuyết phục bởi bầu không khí bi quan của bài viết. Tình hình sẽ thay đổi, nhưng không có nghĩa là chấm hết cho việc dùng AI
Tôi đồng ý với cảm xúc của bài viết, nhưng văn phong quá giống LLM
Đặc biệt là cách chia mục và các câu đinh kiểu “That is not a rounding error. That is a line item that needs its own budget code.”
- Claude tạo ra kiểu câu như vậy rất nhiều
  Khá khó chịu, và với cùng một prompt thì tôi ít thấy Gemini làm thế
- Ngay từ đầu tôi đã không biết bài này là ai viết
  Bài không có tên tác giả
- Pangram đánh dấu bài này là 100% do AI tạo ra với mức tin cậy cao
Brad Gerstner đã xác nhận token không bị bán lỗ
Dù công thức nội bộ có phân bổ khác nhau giữa API và đăng ký, các công ty vẫn có lãi nếu chỉ xét riêng việc bán token thuần túy
Có thể họ vẫn lỗ nếu tính cả lương và thưởng cổ phiếu, nhưng bản thân token hiện tại vẫn đang có lãi
- Cảm giác như đang nhìn một tên lửa gắn động cơ mạnh nhất Trái Đất bay ra khỏi quỹ đạo, rồi tắt máy và nói rằng “nó đang bay mà không cần động lực”
  Bây giờ thì có thể đúng, nhưng đó không phải cách nó đi đến được đây
  Khoản đầu tư cần thu hồi là hàng nghìn tỷ USD trong khi doanh thu cùng lắm là vài chục tỷ USD, nên phép tính cho rằng token sắp có lãi trong ngắn hạn là không đúng
- Token có thể được bán có lãi, nhưng 70% chi tiêu tài nguyên tính toán đang đi vào R&D và huấn luyện mô hình[0]
  Suy luận không thể chỉ cần tự nó có lãi, mà còn phải gánh cả phần chi phí đó
  [0] https://epoch.ai/data-insights/openai-compute-spend
- Không phải bán lỗ, nhưng cũng chưa được bán ở mức đủ cao để trang trải các khoản lỗ và chi phí hiện tại
  Các khoản lỗ đang được xoay vòng trong một cấu trúc tài trợ tuần hoàn kỳ quặc, và đến lúc nào đó rất có thể sẽ sụp đổ thành khủng hoảng nợ
- Nói cách khác, các công ty AI đang có lợi nhuận dương trước khi trừ chi phí
- Tôi không chắc token của Claude Code hay Codex có như vậy không
  Tôi nghĩ bên đó đang được trợ giá mạnh, nhưng đó cũng là những thứ duy nhất khiến tôi thực sự cảm nhận được giá trị
Vấn đề của toàn bộ “AI” là rất dễ sống mà không cần nó
Công ty AI biết điều đó, người dùng biết điều đó, và cả những quản lý thiện cảm nhất với AI agent cũng biết điều đó
Hãy tưởng tượng ngay lúc này xóa sạch toàn bộ AI trên thế giới thì kết quả đơn giản chỉ là công việc diễn ra như bình thường
Bài này chưa nhấn mạnh đủ điểm đó. Ý là phải sợ ngày nào đó việc review PR lại phải giao cho kỹ sư thật sao?
- Tôi nghĩ ở giai đoạn đầu của mọi công nghệ mới đều như vậy
  Công nghệ càng được tích hợp sâu thì điều đó càng bớt đúng
  Vài năm sau khi động cơ điện xuất hiện, người ta cũng có thể nói như thế, rằng cứ quay lại dùng hơi nước là được
  Nhưng giờ thử sống mà không có động cơ điện thì xã hội sẽ sụp đổ
  Câu hỏi không phải là hiện tại có thể không cần nó hay không, mà là sau 5~10 năm nữa khi nó đã được tích hợp hoàn toàn thì có còn không cần được không
- Có lẽ vì thế họ đang càng đẩy mạnh hơn
  Không phải để tạo doanh thu chân thật, mà để cắm sản phẩm AI vào đủ sâu khiến phương án “cứ bỏ AI đi” không còn được xem là lựa chọn nữa
  Kể cả khi chi phí duy trì cứ tăng mãi vượt cả mức cần cứu trợ kiểu hãng hàng không từ chính phủ
  Đây là một lớp trung gian hút của cải mới được bán bằng những lời hứa sai lệch
- Nếu là người dùng JavaScript thì tất nhiên sẽ thấy thế
  Ít nhất để viết JavaScript thì tôi không thể sống thiếu AI
- Tôi luôn thấy lạ khi người ta khuyên dùng công cụ AI cho cả những việc cực kỳ bình thường và phổ thông
  Cảm giác như coi nó là thú cưng, nếu thỉnh thoảng không cho dùng thì nó sẽ chết
Bài này sai. Không phải là các gói đăng ký kiểu đó không được cung cấp cho doanh nghiệp
Các công ty đang trả mức giá gần với API hơn nhiều
Chiến lược là làm cho người dùng quen với token không giới hạn ở gói cá nhân, rồi hy vọng hành vi đó sẽ mang sang nơi làm việc
- Có cung cấp
  Ghế team hay enterprise đắt hơn giá người dùng cá nhân, nhưng là giá cố định với hạn mức sử dụng được đặt lại
  Bạn có thể gán cho thành viên các ghế tương ứng với gói 20/100/200 USD mỗi tháng, hoặc dùng hoàn toàn theo mức sử dụng
  Có nhiều cách mua khác nhau
- Gói đăng ký chắc chắn có cung cấp cho doanh nghiệp
  Cũng có gói tính phí theo mức dùng tương ứng với các gói người dùng cá nhân
- Tôi đã hơi bối rối vì sao lại nói về đăng ký cho doanh nghiệp
  Công ty tôi đang bị tính phí theo mức sử dụng API
- Đọc mấy đoạn như thế này thì càng thấy giống văn bản do AI tạo ra
  “Nhìn tổng thể, mô thức vẫn như nhau. Định giá để thúc đẩy tiếp nhận chứ không phải vì hiệu quả kinh tế. Trói chặt tổ chức. Biến AI thành phần chịu tải trong công việc hằng ngày của mọi nhóm. Hóa đơn để tính sau.”
- Chưa kể quy mô phí API mà bài viết làm ầm lên thực ra vẫn còn tương đối nhỏ
  10.000 USD/tháng không phải là không đáng kể, nhưng nếu số tiền đó hỗ trợ được một đội 10~20 kỹ sư thì đó là đòn bẩy khá tốt
Tôi chưa đọc hết bài gốc, nhưng vẫn nhận ra nó do AI viết
Có thể lấy OpenRouter làm mốc tham chiếu cho giá vốn cung cấp AI
Tôi cứ nghe nói nó đáng tiền hơn Claude, nên nếu vậy thì hoặc Anthropic đặc biệt kém hiệu quả hoặc đang kiếm lãi từ suy luận
Họ có thể đang lỗ ở phần huấn luyện, nhưng đó có lẽ là chi phí để duy trì vị thế phòng thí nghiệm dẫn đầu
Nếu một công ty nào đó sụp vì nợ hay lý do tương tự, doanh nghiệp chẳng phải chỉ cần chuyển sang bên khác thôi sao?
Nếu còn phải nhìn thêm một lần nữa các câu kiểu “It’s not X. It’s Y.” hay cách dùng “load-bearing” như ẩn dụ thì tôi sắp nôn đến nơi
- Tôi đã thấy nó nhả ra khá nhiều kiểu diễn đạt như vậy, và danh sách không hề ngắn
  “Kỷ nguyên trợ giá không kết thúc một cách thanh nhã. Nó đang lộ ra các vết nứt ở khắp nơi.”
  “Câu hỏi không phải là đó có phải một thương vụ tốt hay không. Mà là nó còn trụ được bao lâu.”
  “Một lập trình viên chạy ba hay bốn coding agent cùng lúc không chỉ dùng nhiều gấp 3 hay 4 lần token so với một cuộc trò chuyện chat. Mà là nhiều hơn hơn một bậc độ lớn.”
  “Đây không còn là thử nghiệm nữa. Đây là workflow chịu tải.”
  “Đó không phải sai số làm tròn. Đó là một khoản mục cần mã ngân sách riêng.”
- Nếu có một đợt điều chỉnh giá lớn, rất nhiều người vốn dùng miễn phí hoặc gói 20 USD/tháng để tạo bình luận mạng xã hội có thể sẽ nhìn thấy chi phí thật và quay lại tự viết
  Ít nhất cũng có thể hy vọng như vậy
- Tôi cũng ghét cách nói “the unlock” tương tự như thế
- Bài này phần đầu còn ổn
  Có dữ liệu và lập luận nghe cũng hợp lý, nhưng đến giữa bài thì bắt đầu tung ra ví dụ xu hướng, rồi ví dụ khác, rồi ví dụ thứ ba, rồi “đó không chỉ đơn giản là X mà là Y”
  Nó khó chịu chẳng khác gì đang đọc một bài viết tốt, bấm vào liên kết nguồn rồi bị rickroll
Khách hàng doanh nghiệp đâu có dùng gói Claude Pro 20 USD/tháng
Công ty tôi cấp cho lập trình viên hạn mức sử dụng cỡ 1.000 USD/tháng, và theo tôi mức tiết kiệm so với chi phí API nhiều nhất chỉ khoảng 30%
Không phải mức trợ giá điên rồ
Các vị trí khác thường chỉ được phép 50 USD/tháng, và họ vẫn dùng hết hạn mức đó
GitHub Copilot đã dùng cách này cho ghế business và enterprise, nhưng sắp chạm trần
Tôi nghĩ sau tháng 6, khi họ sắp xếp lại các tài khoản Pro và Pro+ cho người dùng cá nhân, họ sẽ nhanh chóng bắt kịp
Điều tôi lo nhất là OpenAI đang tung token ra để khóa chân khách hàng, nên sau IPO phía OpenAI rất có thể sẽ có thay đổi mạnh về giá và điều khoản
Anthropic thì đã hành xử có trách nhiệm hơn ở điểm này, còn GitHub Copilot cũng có vẻ sẽ chỉnh lại mức trợ giá quá tay trong vài tháng tới
- Chỉ riêng GitHub Copilot là đã trợ giá thật sự vô lý
  Vì họ tính phí theo “request” chứ không phải token
  Một request giá 3 cent có thể đốt hơn 20 USD nếu tính theo token, và cách đó sẽ kết thúc trong tháng này
  Tôi cũng đã dùng GHCP để xử lý những khối công việc lớn nên khá lo, nhưng nhìn bộ ước tính hóa đơn mới thì theo giá API cũng chỉ vào khoảng 150~200 USD/tháng
  Vẫn là có trợ giá so với gói 20 USD/tháng, nhưng không đến mức điên rồ
  Nếu dùng nhiều công cụ coding dạng agent một cách có trách nhiệm thì theo giá API có lẽ sẽ rơi vào khoảng 200 USD mỗi tháng
  Nếu ở mức giá đó mà nhà cung cấp vẫn có lãi, thì với doanh nghiệp ở phương Tây đang thuê lập trình viên, xét tới thời gian tiết kiệm được, đây không phải mức khó chấp nhận
  Rủi ro thật sự nằm ở các vibe coder làm dự án cá nhân
  Kỷ nguyên lạm dụng các gói được trợ giá để tạo ra những ứng dụng khổng lồ đang đi đến hồi kết
Nếu thay thế được lập trình viên thì đắt hơn 20 hay 100 USD/tháng cũng vẫn hợp lý
Vấn đề thật sự của các công ty LLM là ngoài mảng lập trình, họ vẫn chưa chứng minh được giá trị ở các lĩnh vực khác
Nếu không làm được điều đó thì cuối cùng họ chỉ bị hạ xuống thành công cụ viết code
Vì vậy nên họ mới đang gấp, và trọng tâm là còn có thể tự động hóa thêm quy trình công việc nào nữa
Có thể toàn bộ công việc giấy tờ đều sẽ được tự động hóa
Khi các lĩnh vực khác phát triển, họ sẽ đổi mô hình giá
- Họ cũng đang thử ở mức nào đó việc thay thế Figma
  Điều đó có thể có giá trị

taekim34 29 ngày trước

Để tiết kiệm token, điều quan trọng là phải kiểm tra theo thời gian thực xem “lúc này mình đang dùng bao nhiêu”. Đặc biệt, khác với phí thuê bao, mô hình tính phí theo token có thể tăng vọt phi tuyến tùy theo mẫu sử dụng, nên cần nhìn được ở cấp độ từng phiên xem chi phí đang rò rỉ ở đâu thì mới có thể ứng phó. Nếu bạn đang ở môi trường Claude Code, hãy thử cc-token-saver (https://github.com/ww-w-ai/cc-token-saver). Công cụ này hiển thị chi phí theo thời gian thực theo từng phiên và từng khoảng, tự động chặn việc gửi lại tốn kém khi cache hết hạn, và còn tự động ủy quyền các tác vụ nặng sang SubTask chi phí thấp.

iolothebard 2026-05-18

Rốt cuộc rồi cũng sẽ dùng thôi.
Hồi iPhone 3 giá chỉ khoảng 200~300 USD… giờ đã vượt xa 1.000 USD nhưng vẫn đang dùng. Đã nếm thử rồi mà.

prunusnira 2026-05-18

Có vẻ việc xây dựng LLM cục bộ sẽ ngày càng tăng lên.

master6559 2026-05-18

Đắt thì không dùng là được..

aer0700 2026-05-18

Có lẽ vì nghĩ rằng dù đắt thì người ta vẫn sẽ dùng nên các nhà cung cấp LLM mới tăng giá như vậy. Tôi khá tò mò xem các LLM mã nguồn mở như GLM, qwen, deepseek rồi sẽ ra sao. Mọi người có lẽ sẽ bắt đầu tính toán xem có nhất thiết phải trả mức giá này để dùng các mô hình frontier hay không, hay là dù phải bỏ công tự triển khai hạ tầng vLLM thì dùng mã nguồn mở vẫn hợp lý hơn.