- Các tác nhân lập trình và tác nhân đa dụng của Anthropic và OpenAI đang cho thấy tiềm năng doanh thu lớn hơn ở mô hình tính phí theo mức sử dụng của doanh nghiệp thay vì gói đăng ký người dùng cá nhân
- Người dùng nặng của Claude Code và Codex với gói đăng ký $200/tháng tiêu thụ lượng token trị giá $2,180.16 theo giá API, nhưng khách hàng doanh nghiệp không còn được hưởng mức chiết khấu tương tự
- Tháng 4/2026, hai công ty đã công bố chi phí Enterprise cho Codex và Claude Code/Cowork theo sát giá API công khai, đồng thời ra mắt các mô hình frontier đắt hơn
- Trong 703 tin tuyển dụng của OpenAI có 229 vị trí, và trong 390 tin tuyển dụng của Anthropic có 105 vị trí được phân loại là bán hàng/hỗ trợ doanh nghiệp, cho thấy xu hướng chuyển mạnh sang bán hàng trực tiếp
- Tranh cãi về chi phí tại Uber và Microsoft có thể được hiểu là tín hiệu về mức giá có thể chấp nhận được: khách hàng cảm thấy gánh nặng chi phí nhưng vẫn tiếp tục sử dụng, hơn là dấu hiệu AI thất bại
Khách hàng doanh nghiệp bắt đầu trả giá API
- Gói Max $100/tháng của Anthropic và gói Pro $100/tháng của OpenAI là mức giá cực kỳ có lợi cho người dùng nặng các tác nhân lập trình
- Nếu quy đổi mức sử dụng 30 ngày gần nhất theo giá token API bằng ccusage, Anthropic Claude Code tương đương $1,199.79, còn OpenAI Codex tương đương $980.37
- Cộng lại là lượng token trị giá $2,180.16 được dùng với giá $200
- Chênh lệch lớn này xuất hiện ngay cả với nhóm “người dùng khá nhiều”, chứ không phải mức chạy tác nhân suốt cả ngày
- Giả định rằng doanh nghiệp dùng tác nhân ở quy mô lớn cũng sẽ được hưởng mức chiết khấu tương tự hóa ra là không đúng
- Có vẻ như trong 6 tháng gần đây, Anthropic đã chuyển gói Enterprise từ cấu trúc cũ kiểu “bao gồm lượng sử dụng đủ cho một ngày làm việc thông thường” sang cấu trúc $20/tháng mỗi ghế + tính phí API theo mức sử dụng
- OpenAI cũng áp dụng thay đổi giá tương tự vào tháng 4/2026
- Theo Codex rate card, từ ngày 2/4/2026, giá Codex không còn tính theo mỗi tin nhắn mà được căn theo mức sử dụng token API
- Thay đổi ngày 2/4 áp dụng cho gói Plus và Pro mới/cũ, ChatGPT Business, cùng các gói ChatGPT Enterprise mới
- Đến ngày 23/4, thay đổi này cũng áp dụng cho toàn bộ gói ChatGPT Enterprise hiện có, bao gồm Edu, Health, Gov và ChatGPT for Teachers
- Giá được hiển thị dưới dạng “credit”, nhưng có vẻ khớp với chi phí token API theo từng mô hình
- Tính đến tháng 4/2026, chi phí Enterprise của OpenAI Codex và Anthropic Claude Code/Cowork đã ngang với giá API công khai
- Cũng trong tháng đó, hai công ty dẫn đầu về mô hình còn tung ra các mô hình frontier đắt hơn
- GPT-5.5 ra mắt ngày 23/4 có giá API gấp đôi GPT-5.4
- Opus 4.7 ra mắt ngày 16/4, nếu tính cả tokenizer mới, đắt hơn khoảng 1.4 lần so với Opus 4.6
- Tháng 4/2026 chứng kiến đồng thời hai thay đổi: ra mắt mô hình frontier giá cao hơn và đưa khách hàng doanh nghiệp từ mức chiết khấu lớn trước đây về mức giá API
Dấu hiệu cho thấy đã đạt độ phù hợp sản phẩm-thị trường
- Đợt tăng giá đột ngột của Anthropic và OpenAI có thể liên quan đến chuẩn bị IPO, nhưng yếu tố quan trọng hơn là các sản phẩm tác nhân lập trình và tác nhân đa dụng như Claude Code/Cowork và Codex dường như đã tìm ra độ phù hợp sản phẩm-thị trường
- ChatGPT đã đạt được sức hút đại chúng, nhưng việc chuyển sức hút đó thành doanh thu lại khó hơn nhiều
- Mức thu $10–$20/tháng mỗi người dùng là một mô hình kinh doanh ổn, nhưng để gánh nổi chi phí hạ tầng $1 nghìn tỷ, cần duy trì 1–2 tỷ người đăng ký trong suốt 4 năm
- Ngược lại, cấu trúc doanh nghiệp chi trên $200/tháng mỗi người dùng có thể tạo ra doanh thu lớn nhanh hơn nhiều
- Với nhóm người dùng mạnh, mức sử dụng hiện đã tương đương khoảng $1,000 chi phí API mỗi tháng cho mỗi nhà cung cấp
- Tác nhân lập trình tiêu thụ lượng token lớn hơn rất nhiều, nhưng đang trở thành công cụ hằng ngày của lao động chuyên môn có thu nhập cao
- Hiện tại chủ yếu là kỹ sư phần mềm
- Vì chúng có thể tự động hóa các tác vụ có thể diễn đạt bằng lệnh nhập vào máy tính, chúng cũng có thể áp dụng cho nhóm lao động tri thức lành nghề rộng hơn
- Các mô hình phát hành vào tháng 11/2025 đã đưa tác nhân lên mức đủ hữu ích trong thực tế, và trong 6 tháng sau đó, các doanh nghiệp bắt đầu thích nghi với công nghệ này và chi tiêu thực sự tăng lên
- Có thể nói ChatGPT đã đạt độ phù hợp sản phẩm-thị trường vào tháng 2/2023 khi trở thành ứng dụng tiêu dùng tăng trưởng nhanh nhất lịch sử, nhưng ở thời điểm đó nó chưa tạo ra được doanh thu thực chất
- Sự kết hợp giữa tác nhân lập trình và chính sách giá doanh nghiệp dường như là thời điểm các công ty này bắt đầu tạo ra doanh thu rất thực tế
Trọng tâm doanh nghiệp thể hiện qua mở rộng tuyển dụng
- Ngay cả các tin tuyển dụng công khai của OpenAI và Anthropic cũng cho thấy tín hiệu rằng tác nhân doanh nghiệp đã đạt độ phù hợp sản phẩm-thị trường
- OpenAI hiện có 703 tin tuyển dụng, trong đó 229 vị trí, tức 32.6%, được phân loại là liên quan đến bán hàng/hỗ trợ doanh nghiệp
- Bao gồm account executive, “Go To Market”, “Forward Deployed Engineers”, v.v.
- Anthropic có 390 tin tuyển dụng, trong đó 105 vị trí, tức 26.9%, mang tính chất doanh nghiệp
- Việc các phòng thí nghiệm AI chọn mô hình bán hàng doanh nghiệp vốn cần rất nhiều lao động con người là một điều khá mỉa mai
- Các hợp đồng bán hàng doanh nghiệp cần nhiều người tham gia mới có thể chốt được
- Phân tích tuyển dụng được thực hiện bằng cách dùng Claude Code để scrape các trang tuyển dụng, sau đó đi qua JSON API của Datasette, Datasette Cloud và Datasette Agent; kết quả được công khai trong gist
Tranh cãi chi phí bị tiêu thụ như chuyện AI thất bại là thiếu cơ sở
- Ngày càng có nhiều câu chuyện cho rằng các tập đoàn lớn đang gióng chuông cảnh báo vì chi phí dùng AI tăng vọt, nhưng các ví dụ được trích dẫn nhiều dường như đã bị thổi phồng
-
Trường hợp Uber
- Trường hợp được bàn tán nhiều nhất là bài của The Information, trong đó CTO Uber Praveen Neppalli Naga nói rằng Uber đã “đốt sạch toàn bộ ngân sách AI cả năm chỉ trong vài tháng của năm 2026”
- Phần lớn chi phí tăng thêm được cho là đến từ Claude Code
- Vì Claude Code chỉ thực sự cải thiện mạnh vào tháng 11/2025, việc ngân sách lập trong năm 2025 không dự báo được nhu cầu năm 2026 là điều không đáng ngạc nhiên
- Phát biểu của COO Uber Andrew Macdonald trong podcast Rapid Response cũng làm tranh cãi nóng hơn, nhưng đoạn liên quan thực ra khá hạn chế
- Andrew Macdonald nói rằng 25% số commit mã trong quý trước được thực hiện thông qua Claude Code, nhưng rất khó nối mức tăng năng suất đó với việc có hồi sinh được các dự án từng bị cắt bỏ hay tạo thêm 25% tính năng hữu ích cho người dùng hay không
- Phát biểu này dẫn đến các tiêu đề như “AI tokenmaxxing giờ ngày càng khó biện minh hơn” của Business Insider
-
Trường hợp Microsoft
- Một ví dụ phổ biến khác là câu chuyện Microsoft bắt đầu hủy giấy phép Claude Code
- Trên bề mặt, đây là động thái nhằm thúc đẩy kỹ sư sử dụng trực tiếp tác nhân Copilot CLI nội bộ của họ
- Tom Warren của The Verge dẫn nguồn tin cho biết quyết định này cũng có lý do tài chính, gắn với ngày kết thúc năm tài chính 30/6 của Microsoft
- Hai trường hợp này có thể được hiểu không phải là AI thất bại, mà là tín hiệu về mức giá có thể chấp nhận được: giá sản phẩm khiến khách hàng thấy nặng gánh nhưng cuối cùng vẫn chọn mua
- Điều này phù hợp với quan điểm rằng mức giá tốt là mức khiến khách hàng hít một hơi, rồi vẫn nói “đồng ý”
- Việc Uber vượt ngân sách và Microsoft hủy ghế sử dụng có vẻ là biểu hiện thực tế của hiệu ứng đó
Quy mô chi tiêu của các phòng thí nghiệm AI cũng cực lớn
- Các phòng thí nghiệm AI lớn đang chi hàng tỷ USD cho cả huấn luyện lẫn suy luận
- Rất hiếm khi có số liệu chính xác và đáng tin cậy, nhưng gần đây SpaceX S-1 đã hé lộ một manh mối lớn liên quan đến Anthropic
- SpaceX cho biết vào tháng 5/2026, họ đã ký Cloud Services Agreements với Anthropic PBC để cung cấp quyền truy cập năng lực tính toán của COLOSSUS và COLOSSUS II
- Anthropic đồng ý trả cho SpaceX $1.25 tỷ mỗi tháng cho đến tháng 5/2029
- Thông báo của Anthropic nói rằng thỏa thuận này sẽ “tăng giới hạn sử dụng cho Claude Code và Claude API”
- Điều này cho thấy rất rõ rằng Colossus được dùng cho suy luận, chứ không phải huấn luyện mô hình
- Anthropic vốn đã có năng lực tính toán khổng lồ từ các nhà cung cấp khác
- Việc sẵn sàng chi thêm $1.25 tỷ mỗi tháng chỉ cho phần năng lực bổ sung từ một nhà cung cấp cho thấy ngân sách suy luận đã lớn đến mức nào
Tầm quan trọng tương đối của doanh thu API đang giảm
- Trong 2 năm qua, OpenAI dường như có tỷ trọng doanh thu từ đăng ký cao hơn, còn Anthropic có tỷ trọng doanh thu API lớn hơn
- Về mặt lịch sử, doanh thu API của Anthropic phụ thuộc nhiều vào một số ít khách hàng API lớn
- Theo bài của VentureBeat tháng 8/2025, hai khách hàng Cursor và GitHub Copilot chiếm $1.2 tỷ trong tổng doanh thu $4 tỷ khi đó
- Hiện nay có tin đồn Anthropic sẽ đạt doanh thu $10.9 tỷ trong quý 2 và có thể lần đầu tiên tạo ra lợi nhuận hoạt động
- Việc chuyển sang doanh nghiệp cho thấy các phòng thí nghiệm nhận ra rằng kiếm tiền trực tiếp từ khách hàng, thay vì thông qua các trung gian phân phối, mới là nơi có khoản doanh thu lớn hơn
- Claude Code của Anthropic cạnh tranh trực tiếp với Cursor và Copilot
Tháng 4/2026 là một điểm bẻ lái mới
- Tháng 11/2025 có thể xem là điểm bẻ lái tháng 11, khi GPT-5.1 và Opus 4.5 lần lượt kết hợp với bộ harness tác nhân lập trình của mình để trở nên thực sự dùng được
- Trong 6 tháng sau đó, doanh nghiệp đã dần thích nghi với các hệ thống tác nhân có thể thực hiện ổn định những công việc hữu ích
- Tháng 4/2026 có vẻ là một điểm bẻ lái mới, khi tác động doanh thu của thay đổi công nghệ đó bắt đầu bộc lộ rõ rệt
- Theo hướng có lợi nhuận cho các phòng thí nghiệm AI frontier
- Theo hướng tạo tác động thực sự lên ngân sách của các tập đoàn lớn
- Khi các hồ sơ S-1 phục vụ IPO của Anthropic và OpenAI được công bố trong tương lai, chúng ta có thể xác nhận bản chất thật của thời điểm này bằng những con số đã được kiểm toán
1 bình luận
Ý kiến trên Hacker News
Trong 5 năm tới sẽ phải thu hồi 5–10 nghìn tỷ USD, nếu không thì sẽ bắt đầu khấu hao phần mở rộng phần cứng
Điều đó có nghĩa là mỗi năm phải chi hơn 1 nghìn tỷ USD cho token. Nếu lấy mốc 200 triệu lao động tri thức và 30 triệu lập trình viên trên toàn thế giới, thì đó sẽ là một thế giới nơi 5% lương của mọi lao động tri thức, hoặc 20% nếu là lập trình viên, phải đổ vào token
Xung quanh tôi, mọi người nói rằng các công cụ này thực sự giúp tăng tốc 20–40% ở những công việc mà công ty thật sự quan tâm. Nếu tăng chi 20% để đổi lấy tốc độ tăng 20%, thì rất khó biện minh cho mức chi 1 nghìn tỷ USD mỗi năm
Chúng ta vẫn chưa đến mức đó. Hiện tại vẫn đang ở đoạn đi lên của chu kỳ cường điệu, và nếu không khiến lập trình viên trở nên năng suất gấp 2, 5, hay 10 lần trong những công việc quan trọng, thì có lẽ mọi chuyện sẽ không diễn ra tốt đẹp
Các kỹ sư điện tham gia vào data center nói về mức tăng vọt điện năng tiêu thụ khi chạy huấn luyện như thể đó là yếu tố chính của thiết kế, nhưng các bài báo bàn về cost-optimal scaling lại rất tự tin xem lượng tính toán ở giai đoạn suy luận là yếu tố lớn
Một luận điểm ủng hộ ý rằng huấn luyện, ngay cả sau khi khấu hao, vẫn đòi hỏi tính toán nhiều hơn suy luận là: các nhà cung cấp Trung Quốc bị hạn chế mạnh trong việc tiếp cận tài nguyên tính toán đang cung cấp token gần như không giới hạn với giá rẻ hơn, nhưng chất lượng mô hình lại kém hơn. Điều này sẽ hợp lý nếu hiểu rằng các công ty Mỹ đang thổi phồng chi phí suy luận lên gấp 20–30 lần vì chi phí huấn luyện đã khấu hao mà các công ty nước ngoài không thể gánh nổi
Nếu chi phí huấn luyện lớn hơn nhiều so với suy luận, thì họ đang ở trong một thế tiến thoái lưỡng nan của tù nhân còn nghiêm trọng hơn rất nhiều so với mô hình cạnh tranh thông thường với chi phí cận biên bằng 0. Ngược lại, nếu chi phí suy luận lớn hơn, thì có thể phân tích cho rằng đây là loại hình kinh doanh giống utility như một số người vẫn nói. Các CEO có động cơ rất lớn để nói theo hướng đó. Vì nếu phương án còn lại, tức thế tiến thoái lưỡng nan của tù nhân, lộ ra thì đầu tư sẽ dừng lại rất nhanh
Thực ra thứ duy nhất hơi chạm được vào sự thật là các tin đồn từ giới kỹ sư cơ sở hạ tầng; còn lại gần như chỉ là phân tích cấp cao và kiểu điều hành trên giấy đối với một ngành kinh doanh đầy bí mật. Điều đó cho thấy mức độ hiểu biết hiện tại
Nếu ngay cả tỷ lệ giữa capex đã khấu hao và opex cũng không biết, thì nhà đầu tư bên ngoài không thể phân tích gì được. Có chia nhỏ kế toán chậu cây văn phòng và chậu cây trong nhà đến mấy cũng vô nghĩa nếu phần lớn nhất của doanh nghiệp bị che bởi bí mật thương mại
Dự báo chi phí AI-as-a-service sẽ vượt mức đó trong chưa đầy một năm
Có vẻ chỉ vài năm nữa thôi, ngay cả công ty rất nhỏ cũng sẽ có thể mua được phần cứng đủ để chạy các mô hình tuyến đầu, đủ tốt cho hầu hết công việc, với mức giá chấp nhận được
Nếu đã vượt qua giai đoạn tiềm năng để bước vào giai đoạn tăng năng suất có ý nghĩa, thì tại sao điều đó không xuất hiện trong các chỉ số phía khách hàng?
Vì sao Delta Airlines lại không cải thiện mạnh hiệu quả vận hành trong 3 tháng qua nhờ áp dụng phần mềm tốt hơn?
Tôi thật sự tò mò. Tôi thấy có một sự đứt gãy
Khi cable TV và Pay Per View xuất hiện, có nghiên cứu về việc nếu mọi người có quyền truy cập không giới hạn vào phim thì họ sẽ xem bao nhiêu, và kết quả đã được lan truyền như bằng chứng rằng phải triển khai toàn bộ hạ tầng để chống lưng cho ngành này. Nhưng khi các nhà thống kê phân tích dữ liệu kỹ hơn, họ đi đến kết luận rằng mọi người trả lời là họ sẽ xem phim mỗi ngày, 7 ngày một tuần, 10–12 tiếng một ngày. Đó là những con số bất khả thi
Bây giờ tôi cũng có cảm giác đang ở trên một con thuyền tương tự. Một số người đang giả định rằng ai cũng sẽ dùng lượng token tối đa, và giá token sẽ không bao giờ rẻ đi bất chấp những cải thiện về phần cứng, phần mềm, thiết kế và áp lực thị trường
Mỗi thế hệ công cụ cho lập trình viên đều làm tăng thông lượng code tuyệt đối, đồng thời tạo ra những tầng lớp lập trình viên mới và người dùng mới
Từ compiler đầu tiên, qua thời đại framework cho đến nay, luôn là như vậy, và mức độ thành thạo cần có để trở thành lập trình viên đã giảm xuống. Vào nửa sau thập niên 80, cần những nhà khoa học máy tính trình độ thạc sĩ hoặc tiến sĩ mới có thể viết ứng dụng; sau đó hạ xuống sinh viên đại học và kỹ sư IT, rồi lý thuyết khoa học máy tính phần lớn trở thành tùy chọn; sau nữa hạ xuống cả những cử nhân chỉ được đào tạo đôi chút; và trước năm 2022 còn đi qua các công cụ no-code/low-code như retool, rồi nay đang hạ tiếp qua các dịch vụ sinh code bằng agent như v0/Replit
Thế hệ lập trình viên tiếp theo sẽ không xây ứng dụng và kiến trúc như các thế hệ trước. Phần lớn mọi người ở đây cũng sẽ không làm ra được với chất lượng như khi pg xây nền tảng này, nhưng nếu người dùng thấy có giá trị thì điều đó không quan trọng. Rất nhiều ứng dụng doanh nghiệp chất lượng trung bình đã chứng minh điều đó rồi
Cuối cùng, logic của các doanh nghiệp này là con số 200 triệu/30 triệu sẽ không giữ nguyên. Tôi cũng nghĩ thay đổi đó có lẽ không đủ lớn và đủ nhanh để biện minh cho capex. Nhưng Web 1, Web 2.0, SaaS và cuộc cách mạng di động cũng đã tạo ra những tầng lớp người dùng và lập trình viên mới khá nhanh, nên điều đó không hoàn toàn phi thực tế
[1] HN là một ngoại lệ rất mạnh vì dùng triển khai Lisp tùy biến, nhưng ở thời kỳ trước cũng có nhiều ví dụ dùng những lựa chọn bớt cực đoan hơn mà vẫn có kiến trúc rất vững, và mức độ thành thạo đó có thể khó tìm thấy ở thế hệ startup ngày nay
Phân tích này khá rối. Product-market fit (PMF) ở mảng lập trình có lẽ đã đạt được từ năm ngoái rồi. Khả năng sinh lời là chuyện khác và vẫn chưa rõ
Bài viết trộn lẫn hai thứ đó nhưng lại không đưa ra lập luận kinh tế mạnh hay các con số đủ thuyết phục. Cũng không hiểu vì sao ví dụ về Uber lại liên quan. Ngay cả COO của Uber cũng đã nói rất rõ rằng ít nhất từ góc độ lợi nhuận trên vốn đầu tư thì vẫn chưa thấy kết quả
Theo tôi, sản phẩm này đã rất hữu ích cho việc lập trình từ vài tháng trước. Nhưng tuyệt đối không phải là hữu ích ở mọi mức chi phí
Như Simon nói, mới chỉ 6 tháng kể từ khi xuất hiện các coding agent “đủ tốt”, và khoảng thời gian đó chỉ như một cái chớp mắt. Thế mà ở công ty tôi, công việc của tôi đã thay đổi hoàn toàn và gần như trong mơ
Và đó mới chỉ là một điểm bẻ ngoặt. Đã có nhiều điểm bẻ ngoặt rồi và phía trước còn nhiều hơn nữa. Tôi có thể bị thuyết phục bởi lập luận rằng ngay lúc này ROI vẫn chưa dương trước mức chi tiêu doanh nghiệp vô lý, nhưng việc mở đường từ bây giờ để chuẩn bị cho những gì sẽ đến trong vài tháng nữa, xa hơn là vài năm nữa, vẫn hoàn toàn hợp lý
Với những người đã bỏ thời gian dùng thử và tìm hiểu, nó đã rõ ràng là hữu ích từ vài tháng trước, nhưng giờ thì hiểu biết đó đã lan tới cả những người nắm hầu bao, khiến họ tin rằng đây không chỉ là một trào lưu hay cường điệu, nên giờ mới có thể “khẳng định” là có PMF
Tuy vậy, tôi đồng ý rằng nói “mấy công ty đó đã có PMF” nghe vẫn khá lạ. Bình thường đây là khái niệm được dùng để mô tả chính sản phẩm của mình
Vì thế nhiều người ở đây tốt hơn hết là không nên tham gia cuộc thảo luận. Họ chỉ lặp lại các lợi ích mà không xác định hay giải thích được chi phí và những chi phí đó ảnh hưởng thế nào đến tình hình tài chính của công ty
“Lý do tôi gọi tháng 11 năm 2025 là điểm bẻ ngoặt tháng 11 là vì GPT-5.1 và Opus 4.5, khi kết hợp với bộ khung coding agent tương ứng của chúng, đã trở nên tốt hơn. Chúng đã đủ tốt để ổn định hoàn thành công việc hữu ích, và chúng tôi đã thích nghi với các hệ thống agent trong 6 tháng qua”
Đọc các bài khác cũng thấy hầu như không có hoài nghi, chủ yếu là nội dung quảng bá chúng tuyệt vời đến mức nào
Bài này có hơi mang cảm giác kiểu loạn thần AI
“Những công cụ này đốt nhiều token hơn rất nhiều, nhưng đang nhanh chóng trở thành công cụ hằng ngày cho công việc do các chuyên gia lương rất cao thực hiện”
“Bằng cách nào đó, mẩu này lại bị biến thành những tiêu đề kiểu ‘COO của Uber nói ngày càng khó biện minh cho chi tiêu tiêu hao token AI’, vì thị trường cho các câu chuyện AI thất bại vẫn còn rất lớn”
Ừ, chắc chỉ là người ta muốn thấy AI thất bại thôi. Chứ không thể nào là chi phí bùng nổ, doanh thu kỷ lục và sa thải quy mô lớn. Cũng không thể có khả năng những người vốn đã được trả lương cao đang đốt tiền bằng các công cụ này mà lại chẳng tạo ra thêm “giá trị” nào. Tôi công nhận sản lượng tăng gấp 100 lần nhưng kết quả thì phẳng lì ở mọi chỉ số
[1] https://cmr.berkeley.edu/2025/10/seven-myths-about-ai-and-pr...
[2] https://futuretech.mit.edu/publication/crashing-waves-vs-ris...
Nếu GLM-5.1 tốt tương đương, mã nguồn mở và rẻ hơn rất nhiều, thì OpenAI và Anthropic định giữ chân khách hàng bằng cách nào?
Có vẻ mô hình kinh doanh này sẽ không hoạt động. Một người bạn rất thân của tôi đang thực sự làm phần mềm tự động hóa cho doanh nghiệp lớn, và hoàn toàn không dùng Claude hay OpenAI
Chủ yếu dùng gpt 120b và GLM-5.1 trên Cerebras cho các tác vụ suy luận nặng, và dùng các mô hình nhỏ khác cho nhiều tác vụ khác nhau. Tất cả đều là mã nguồn mở
Các hệ thống này cực kỳ hữu ích cho doanh nghiệp, và có thể chạy pipeline hoàn toàn tự động rất ổn định và nhanh
Chúng tôi nói về chủ đề này khá thường xuyên, và cả hai đều nghĩ rằng các công ty đang làm tác vụ agent nặng với Claude và OpenAI dường như không thực sự biết mã nguồn mở đã tốt hơn và rẻ hơn đến mức nào trong 1 năm qua
Vậy khi các doanh nghiệp và nhà phát triển hiện có bắt kịp, chẳng phải Claude và OpenAI sẽ không thể thu hồi chi phí sao?
Sẽ có cực kỳ nhiều công ty cạnh tranh trong không gian này, và dù tính chất thâm dụng vốn có tạo ra một mức độ hào lũy nhất định, thực tế vẫn sẽ có số đối thủ gần như vô hạn
Điều đó tốt cho người tiêu dùng
Tôi nói vậy với tư cách là người rất thích dùng GLM cho các trang dịch thuật vì hiệu năng trên giá thành của nó đủ tốt
Hiện tại phần lớn tiền nằm ở coding. Chỉ cần OpenAI và Anthropic đi trước mô hình mã nguồn mở tối tân 6 tháng thôi là họ có thể chiếm phần lớn thị trường doanh nghiệp và nhà phát triển
Bạn có thể cho tôi gợi ý về cách khai thác mô hình mở để lấy ra nhiều giá trị hơn không?
Tôi đồng ý với nhận định phổ biến rằng các mô hình mở chậm khoảng 1 năm. Nhưng khoảng 1 năm trước đã có một bước nhảy gần như kỳ diệu khiến các mô hình tối tân trở nên cực kỳ hữu dụng. Theo logic đó thì sớm muộn mô hình mở cũng phải hoạt động tốt, nhưng tôi lo là có điều gì đó hơn cả việc chỉ chờ Trái Đất quay thêm một vòng
Nhân tiện, trường hợp dùng của tôi là hỗ trợ coding. Với mục đích khác thì mô hình mở có thể rất tuyệt
Tôi chưa từng thấy một phân tích thuyết phục nào về ROI của việc tự chạy mô hình coding. Nhất là khi so với các gói 20 USD hoặc 200 USD mỗi tháng
Cách nói “200 USD cho lượng token trị giá 2.180,16 USD” nghe kỳ lạ
Token không có chi phí hay giá trị nội tại. Nói rằng đã dùng lượng token trị giá 2.180,16 USD cũng giống như tin một nhân viên bán hàng thuyết phục rằng bộ nồi 19,99 USD có giá trị tới 1 tỷ USD
Thật buồn cười khi người ta vứt tư duy phản biện ra ngoài cửa sổ khi đánh giá một nguồn tin thiên lệch
Tôi đã chi 200 USD. Nếu trả theo giá API thì sẽ là 2.180,16 USD. Bài viết nói về việc khách hàng doanh nghiệp trả giá API, và ý là nếu tôi được thuê ở một công ty như vậy thì tôi đã tạo ra chi phí 2.180,16 USD cho công ty
Tôi đã bỏ sót điều gì sao?
Giá trị thì khó tính hơn, nhưng may thay cơ chế giá thị trường tồn tại đúng để phục vụ mục đích đó. Không có con số nào tốt hơn mức giá mà người ta sẵn sàng trả
Vì vậy ở gói doanh nghiệp thì đúng là sẽ tốn 2.180,16 USD. Bản thân người đó không trả mức đó, nhưng doanh nghiệp thì có
Giá theo token của cả mô hình tuyến đầu đóng và mô hình open-weights đều ở trong cùng một khoảng, tức từ cent đến đô la cho mỗi triệu token. Với tôi, đây là tín hiệu cho thấy mức giá đó phần nào bám sát thực tế
Thời điểm thực sự nằm ở chỗ hiện nay nhu cầu cho các mảng kinh doanh mới mạnh là không nhiều, và vì đã tích lũy đủ tài sản kỹ thuật nên công việc ngày càng trở thành công việc gia tăng
Tức là có thể xây các tính năng ổn định trên một khối lượng công việc quá khứ đồ sộ, và đây chính là nơi AI đặc biệt tỏa sáng. Vì vậy dù có AI hay không, nếu phần lớn công việc chỉ là thêm một tính năng, sửa một lỗi, chỉnh một chút cấu hình, thì các công ty vốn dĩ cũng đã tuyển ít kỹ sư phần mềm hơn. AI chỉ đẩy nhanh áp lực đó
Ngược lại, hãy tưởng tượng nếu có cùng loại AI này vào 20 năm trước thì sẽ khác. Khi người ta còn đang cố hiểu JAX-RS, liệu AI có thực sự dùng được Jersey không? Khi React vừa mới được phát minh, liệu nó có thể trả lời mọi câu hỏi về React không? Liệu có thể giảm số người xây toàn bộ hạ tầng cloud công cộng hay các nền tảng gọi là big data xuống còn 1/10 không? Khi đó mọi thứ đang tiến hóa rất nhanh, nên cần rất nhiều kỹ sư để khám phá vô số khả năng. Tôi cũng rất nghi ngờ chuyện có thể xây hệ sinh thái machine learning với chỉ 1/10 nhân lực nhờ AI. 20 năm trước, R mới là chủ đạo còn hệ sinh thái Python thì hoàn toàn chưa trưởng thành. Mobile computing cũng vậy, liệu AI có thể giảm số người làm mọi ứng dụng di động và hạ tầng nền tảng xuống còn 1/10 không?
Còn với câu “liệu có thể xây hạ tầng cloud công cộng hay nền tảng big data với 1/10 nhân lực không?” thì tôi nghĩ là không. Nó không giải quyết được các vấn đề cốt lõi, và khi quy mô lớn lên thì sẽ tạo ra mớ hỗn độn
Về công việc gia tăng thì đúng. Nhưng xét về mặt lịch sử thì phần lớn công việc vốn dĩ đã là công việc gia tăng, còn các vị trí R&D chỉ là thiểu số
Phải công nhận điều cần công nhận. Toàn bộ chuyện này là một cú lừa vĩ đại bậc nhất trong lịch sử
AI có những trường hợp sử dụng hữu ích, nhưng không phải ở mức giá hiện tại. Tôi đã dùng AI từ thời GPT-2 cùng với khá nhiều người dùng hạng nặng. Mọi người đều kể cùng một câu chuyện: tò mò, kinh ngạc, cường điệu, ghét bỏ, rồi ngộ ra. Doanh nghiệp thường chậm hơn một chút, và hiện tại chúng ta đang ở trong chu kỳ cường điệu. Đó chính là lúc bán hết mọi hợp đồng và IPO
Đúng kiểu nước đi trong sách giáo khoa của VC
Điều không nên hiểu sai là AI có các ca sử dụng hữu ích. Chỉ là không theo cách họ muốn. Nó khá giống blockchain. Ý tưởng về tiền tệ phi tập trung có quyền tồn tại. 99% các đồng coin khác thì không
AI là một công cụ tìm kiếm nhanh hơn nhưng vẫn kém chính xác hơn. Nó rất tuyệt để tìm bug và cũng tốt cho rubber duck debugging
Tôi gọi đây là cú lừa vì cùng với marketing, nó tạo cho vô số người trên khắp thế giới ấn tượng rằng giờ họ có thể xây startup, game, hạ tầng... mà không cần tự mình học nữa. Kết quả là hàng triệu dự án và sản phẩm chất lượng thấp bị bỏ hoang. Phần lớn chưa từng hình thành được mô hình tư duy cần thiết để giải quyết vấn đề một cách thấu đáo. Cuối cùng họ lãng phí vài tháng và tiền bạc, chỉ để đốt token. Đó là lý do tôi gọi nó là cú lừa
Tất cả những người dùng sớm mà tôi biết đều đã giảm mạnh mức sử dụng, không phải vì tiền mà vì không có ca sử dụng mới. Khi khám phá dự án mới, bạn chỉ cần onboard thật nhanh, học được nhiều thứ, rồi chuyển sang tài liệu và kiểm thử thực tế là xong. Mức sử dụng của tôi hiện đang thấp nhất trong 2 năm qua
Tôi sẽ không để AI đụng vào code của mình. Tôi lo nó sẽ lại bò ngược lên. Thay vào đó, tôi để nó đọc code của mình và chỉ ra tôi đã làm sai điều gì để tự rèn giũa bản thân
Có hàng trăm công ty, kể cả các giải pháp mã nguồn mở, có thể cung cấp được chừng đó
Những người bạn không làm kỹ thuật của tôi hiện đều đang ở trong chu kỳ cường điệu, và chia sẻ với tôi sự phấn khích cùng nỗi thất vọng có thể đoán trước đang chờ phía trước
Ở một khía cạnh nào đó, việc AI được tận dụng triệt để theo kiểu VC, có chủ đích hay vô thức, để tạo ra những công ty khổng lồ ngay trước mắt cả thế giới là điều khá ấn tượng
Ý bạn là ROI của các mô hình lập trình dùng token không dương nên đó là một cú lừa? Ví dụ, chúng không tạo ra đủ giá trị để đáng với 100 USD mỗi tháng?
Ý bạn là khách hàng doanh nghiệp không đủ thông minh để nhìn ra điều đó?
Rốt cuộc đây là một kiểu ảo tưởng giống blockchain, rồi IPO để tối đa hóa lợi nhuận cho CEO?
Tôi hiểu đúng chứ, hay tôi đang gán thêm ý vào lời bạn?
Phần “tạo cho mọi người ấn tượng rằng giờ họ có thể xây startup, game, hạ tầng của riêng mình mà không cần tự học” có phải là dựng người rơm không, vì ta không thể khẳng định niềm tin và động cơ của người khác? AI là một công cụ mạnh để khuếch đại năng lực con người. Bạn không thể chỉ nhập prompt kiểu “hãy làm cho tôi một ứng dụng enterprise SaaS trị giá 1 tỷ USD” hay “hãy làm GTA6 cho tôi, đừng hallucinate” là xong. Nhưng có thật là người ta đang có ấn tượng như vậy không? Dario và Sam có đang nói rằng “hãy mua gói đăng ký coding agent của chúng tôi, bạn sẽ làm game trong một phát mà không cần kỹ năng kỹ thuật và sẽ giàu lên” không?
Việc bạn không thấy giá trị ở AI agent thì hôm nay hoàn toàn có thể như vậy. Cảm thấy lấn cấn cũng chẳng sao. Nhưng gọi nó là cú lừa ngang hàng với blockchain thì theo tôi là mâu thuẫn với những tín hiệu rất mạnh, cũng như với các cuộc trao đổi thực tế về việc những hệ thống này làm được gì hôm nay và người ta kỳ vọng chúng sẽ làm được gì vào cuối năm nay
Theo những gì tôi đọc thì Anthropic thực ra không có lãi, và có vẻ chỉ trông như có lãi trong chốc lát do chiết khấu. Bài này lập luận rất tốt về điều đó: https://www.wheresyoured.at/anthropics-profitability-swindle...
Tôi cũng hoài nghi liệu việc tăng giá hiện tại đã đủ hay chưa, và liệu đa số người dùng cùng doanh nghiệp có chấp nhận những đợt tăng giá lớn hơn nữa trong tương lai hay không. Đặc biệt với người dùng cá nhân, 200 USD/tháng đã là cực kỳ đắt rồi; tôi không nghĩ phần lớn sẽ trả các mức như 1.000 USD/tháng
Có lẽ cứ nên bỏ ngoài tai tin tức về LLM cho đến khi các công ty này IPO xong. Có rất nhiều bot đang cố tạo dựng dư luận tích cực
200 USD mỗi ghế mỗi tháng chẳng là gì cả
Một gói license 3D CAD mà người trong nhóm R&D của chúng tôi dùng có giá hàng nghìn USD mỗi ghế mỗi tháng
Đã đến lúc các ghế phần mềm cũng được yêu thương rồi
[1] https://www.autodesk.com/products/autocad/buy
Doanh nghiệp đang trả theo usage-based pricing, chứ không phải “buffet không giới hạn” của gói cố định