Quyết định và tiền: Cách một công ty sống sót trước câu hỏi “Nếu Anthropic làm ra thứ này thì sao?”
(writing.nikunjk.com)- Khi các mô hình AI ngày càng mạnh, giá trị của bản thân phần mềm sẽ giảm; các công ty ứng dụng muốn tồn tại cần đồng thời chuyển mình thành công ty dữ liệu và công ty fintech
- Khi agent trở thành người dùng chính của phần mềm, mô hình định giá theo từng ghế (per-seat) sụp đổ; một nghìn người vận hành một trăm nghìn agent không có nghĩa là một trăm nghìn ghế, nên thứ duy nhất còn lại để tính phí là các quyết định mà agent để lại (dữ liệu) và dòng tiền mà chúng dịch chuyển (fintech)
- Các mô hình frontier giống như một nhóm thiên tài không biết cách công ty vận hành; phán đoán ngầm (judgment) của con người mới là hào lũy thật sự, còn lịch sử chỉnh sửa (corrections) khi người dùng sửa kết quả của mô hình đóng vai trò tín hiệu học và bộ kiểm thử
- Nếu dữ liệu không có tiền chảy qua thì chỉ là một dự án khoa học; chỉ fintech có mạng lưới và lock-in như Toast, Ramp, Shopify mới có thể duy trì biên lợi nhuận ngay cả khi giá mô hình giảm
- Tích lũy phán đoán, kiểm soát dòng tiền và bảo vệ thao tác ghi (writes) là con đường duy nhất để vẫn là một công ty không thể thay thế, ngay cả khi Lab nhìn thấy mọi token
Sự tiến bộ của mô hình và sự suy giảm giá trị phần mềm
- Hôm qua Claude Fable 5 được ra mắt, mô hình Mythos-class đầu tiên mà công chúng có thể sử dụng; đứng đầu gần như mọi benchmark, và tác vụ càng dài thì khoảng cách càng nới rộng
- Mô hình càng thông minh, giá trị của bản thân phần mềm càng giảm
- Mọi công ty ứng dụng được đầu tư mạo hiểm giờ phải là công ty dữ liệu hoặc công ty fintech, lý tưởng nhất là cả hai
Sự thay đổi trong việc ai sử dụng phần mềm
- Trong một bài viết hai năm trước, tác giả đã chỉ ra rằng khi agent trở thành người dùng, mô hình định giá theo từng ghế (per-seat) sẽ đổ vỡ, và có vẻ như chúng ta đã vượt qua lằn ranh đó
- Cloudflare thông báo rằng lưu lượng từ agent lần đầu tiên vượt lưu lượng từ con người
- Dù còn tranh luận trên mạng, xu hướng agent trở thành khách hàng chính của mọi phần mềm là rõ ràng
- Một nghìn nhân viên vận hành một trăm nghìn agent không phải là một trăm nghìn ghế
- Hai thứ agent để lại có thể tính phí là quyết định (=dữ liệu) mà chúng đưa ra và tiền (=fintech) mà chúng dịch chuyển
Quyết định (Decisions) — hào lũy dữ liệu
- xAI có quyền chọn mua Cursor với giá 60 tỷ USD; Cursor có doanh thu thường niên hóa khoảng 4 tỷ USD
- Đó không phải là lý do chính khiến phần mềm được trả giá đắt
- Anthropic và OpenAI đã quan sát công việc của lập trình viên theo thời gian thực thông qua Claude Code và Codex
- Lý do xAI mua Cursor là để đi vào dòng token (token flow) nhanh nhất
- Musk (người đầu tiên trên thế giới đạt nghìn tỷ USD tài sản) nói rằng hồ sơ về việc một triệu lập trình viên thực sự dùng mô hình sẽ đi thẳng vào huấn luyện Grok; mức giá cao là phí cầu đường để bỏ qua nhiều năm thu thập dữ liệu chậm chạp
- Chỉ vài tuần sau khi Cursor ra mắt đã xuất hiện các bản clone hoạt động được, nhưng không cái nào trụ lại, vì cuộc chơi nằm ở gu thẩm mỹ/sự tinh tế (taste)
- Hàng nghìn phán đoán nhỏ về việc nên hiển thị gì và khi nào nên biến mất
- Clone chỉ sao chép giao diện, không thể thừa hưởng hồ sơ nhiều năm lập trình viên chấp nhận, từ chối và viết lại
- Cursor giờ huấn luyện mô hình riêng bằng chính các diff đó, và dữ liệu trở thành hào lũy bậc nhất
- Lý do cho mức định giá 60 tỷ USD: giống như thay 90% nhân viên bằng một đội thiên tài hoàn toàn không biết cách công ty vận hành
- Fable 5 giải được 80% các tác vụ phần mềm thực tế mà mô hình tốt nhất năm ngoái chỉ xử lý được khoảng một nửa; các thiên tài khó phân biệt với nhau và có thể thay thế cho nhau
- Có một lý do khiến họ thất bại: không ai biết những điều mà những người bị thay thế từng biết
Tri thức ngầm (tacit knowledge) và sự tích lũy phán đoán
- Giải pháp tạm thời là lấy kiến thức trong đầu con người ra và đưa cho mô hình làm context, nhưng phần lớn không tồn tại ở dạng có cấu trúc
- Thương vụ đã bỏ qua, một dòng code bị revert lúc 2 giờ sáng, khách hàng mà không ai theo đuổi và cũng không ghi lại lý do — đó mới là phần cốt lõi thật sự
- Đó là phán đoán không thể viết thành workflow và hiện chưa được lưu trữ
- Giờ đây chúng ta đang chuyển từ context → harness → judgment
- Context là truy hồi (retrieval), đặt đúng mảnh thông tin trước mô hình
- Harness là vòng lặp (scaffolding) mà mô hình có thể chạy trong đó
- Judgment là lớp cuối cùng và là lớp duy nhất tích lũy theo lãi kép; mọi lần gọi, chỉnh sửa và quay lui đều để lại dấu vết trên dữ liệu
- Trong mọi pitch về ứng dụng AI hiện nay, slide về context đều được nêu như hào lũy, nhưng giờ nó chỉ còn là table stakes
- Vì mọi đối thủ đều đang lắp ráp context theo cùng một cách
Hai vai trò của lịch sử chỉnh sửa (corrections)
- Có thể xem chỉnh sửa như một bảng điểm (scorecard); mỗi lần người dùng sửa kết quả của mô hình, nó ghi lại điều gì là đúng trong nghiệp vụ đó
- Bảng điểm làm đồng thời hai việc
- Tín hiệu học để tinh chỉnh mô hình đi mượn cho phù hợp với nghiệp vụ đó
- Bộ kiểm thử, phương tiện duy nhất để biết agent có thật sự tiến bộ hay không; benchmark công khai không đo được workflow cụ thể
- Không cần pretrain mô hình từ đầu, ngay cả Cursor cũng không làm vậy
- Mô hình riêng của Cursor nằm trên một nền tảng mã nguồn mở, và diff phụ trách phần khác biệt hóa
- Chi phí fine-tuning và RL trên các mô hình frontier đã đủ rẻ để một công ty Series B cũng có thể chạy vòng lặp này; hai năm trước thì cần lab
- Sarah Guo gọi lĩnh vực này là the untrainable (những công việc mà bên ngoài không thể chấm đúng/sai), và chỉnh sửa là cách sở hữu nó
Ví dụ từ các công ty dẫn đầu AI theo ngành dọc (vertical)
- Harvey đạt 11 tỷ USD, Legora vượt 5 tỷ USD, cả hai đều nhắm vào thị trường pháp lý
- Họ đang chạy vượt ra ngoài công cụ độc lập để sở hữu toàn bộ vụ việc (matter), vì những chỉnh sửa luật sư thực hiện trên bản nháp là các corrections không ai khác thấy được
- Rogo áp dụng cùng chiến lược trong tài chính, nắm bắt quá trình analyst xây mô hình và sửa memo
- Không công ty nào trong số này huấn luyện foundation model; họ xây harness quanh mô hình đi mượn và sở hữu judgment chảy bên trong, thứ tích lũy theo lãi kép
- Các ông lớn hiện hữu cũng vậy
- Figma sở hữu nhiều hơn SVG: lịch sử thiết kế đi từ v1 đến v47 và mọi phiên bản bị loại bỏ giữa đường — hồ sơ được chấm điểm của gu thiết kế
- Linear sở hữu các tranh luận bên dưới mọi ticket đã đóng
- Notion sở hữu hình dạng tư duy của đội nhóm qua một nghìn lần chỉnh sửa
- Dù đối thủ cố giành khách hàng, tất cả những thứ này không thể export; đó là câu trả lời không có trong mô hình generic
Xu hướng các Lab mua phán đoán
- Các Lab đang mua phán đoán dạng hàng có sẵn, bắt đầu từ dữ liệu do con người gán nhãn
- Mercor được định giá 10 tỷ USD, trả 85 USD/giờ cho mạng lưới chuyên gia
- Meta trả 14 tỷ USD cho Scale để sở hữu pipeline
- Một startup ở New York dọn căn hộ miễn phí nếu được quay lại toàn bộ quá trình, vì đội robotics cần xem con người quyết định hành động tiếp theo như thế nào
- Nhiều công ty RL environment bán phán đoán cho các tác vụ dài hạn và đã đạt doanh thu thường niên hóa hàng trăm triệu USD
- Các Lab đã học từ toàn bộ Internet đến cạn kiệt, và giờ đang mua trực tiếp các quyết định
Tiền (Dollars) — hào lũy fintech
- 23andMe có DNA của 15 triệu người nhưng vẫn phá sản năm ngoái
- Nếu dữ liệu không có tiền chảy qua, nó chỉ là việc chờ tài trợ cho một dự án khoa học
- Phần lớn nhà sáng lập đang bỏ lỡ một nửa này
- Toast đã nhận ra điều này từ nhiều năm trước: nhà hàng về bản chất là bộ xử lý thanh toán có gắn thêm nhà bếp
- Thanh toán tạo doanh thu lớn hơn phần mềm rất nhiều
- Ramp còn đi xa hơn: thẻ doanh nghiệp miễn phí, không có phí ở bất cứ đâu; khi một tỷ USD chảy qua, họ lấy 1–2 cent trên mỗi đô la
- Một công ty 32 tỷ USD được xây trên sai số làm tròn; thẻ miễn phí là cổng chính dẫn tới interchange
- Swipe fee được duy trì nhờ mạng lưới chống đỡ, và tiền còn tạo lợi nhuận bằng cách gom float trong thời gian nó lưu lại
- Không phải mọi đồng hồ đo tiền đều có hào lũy
- Một ứng dụng vibe-coding phổ biến có biên lợi nhuận khoảng 50% trên credit bán ra, phần lớn doanh thu thường niên hóa là markup trên inference
- Đằng sau markup token không có mạng lưới, và chi phí inference của chính họ cũng giảm theo từng quý; khi mô hình rẻ đi, biên lợi nhuận tan chảy
- Fintech bền vững là thứ có lock-in bên dưới — thanh toán được mạng lưới chống đỡ, khoản vay được bảo lãnh bằng dữ liệu mà ngân hàng không nhìn thấy
Hạ tầng thanh toán cho agent
- Hạ tầng thanh toán cho agent cuối cùng đã đi vào hoạt động
- Khi agent đặt vé máy bay, đặt linh kiện và trả tiền cho vendor, phải có thứ gì đó phê duyệt, vận chuyển khoản thu và lấy phí
- Stripe ra mắt giao thức cho việc này, Visa và Mastercard đang cạnh tranh giành chuẩn
- OpenAI đã khấu trừ vài phần trăm trên mọi thứ agent của họ mua
- Giao dịch của một nghìn tỷ agent sẽ sớm nổi lên thành nền kinh tế thanh toán lớn nhất lịch sử
Chuyển hóa bên này thành bên kia
- Những công ty ứng dụng tốt nhất, tồn tại lâu dài, không xử lý hai nửa này tách rời nhau
- Judgment là hồ sơ các quyết định về công việc; fintech là hồ sơ các quyết định về tiền; công ty mạnh chuyển hóa bên này thành bên kia
- Shopify là ví dụ tốt nhất
- Bắt đầu bằng phần mềm cửa hàng → gắn thêm thanh toán → cung cấp khoản vay qua Shopify Capital, được bảo lãnh bằng dữ liệu doanh thu chảy qua cửa hàng; loại khoản vay mà ngân hàng không thể tự làm
- Khi merchant lớn lên, doanh thu tăng và dữ liệu giúp cho khoản vay tiếp theo
- Hiện khoảng ba phần tư doanh thu của Shopify đến từ phía tiền, không phải subscription phần mềm
- Stripe vận hành cùng vòng lặp với Radar, Ramp với dữ liệu chi tiêu và thẻ
- Rippling cũng thử cách tương tự, đối tượng cốt lõi là nhân viên
- Lương, phúc lợi, thiết bị và thẻ đều dựa vào một source of truth duy nhất
- Chưa ai tạo được lock-in, và Gusto cùng Deel vẫn tăng trưởng song song, nhưng công ty sở hữu đối tượng sẽ tích lũy theo lãi kép trong khi phần còn lại phải lắp ráp bằng tay
Bảo vệ thao tác ghi (Guard the writes)
- Tồn tại một căng thẳng “headless” mà chưa ai giải được
- Khi mọi phần mềm đều được agent sử dụng, để hữu ích thì phải cho agent vào, nhưng để sống sót thì không thể để chúng lấy hết mọi thứ
- Mọi system of record phải đủ mở để agent có thể kết nối bằng bất kỳ giao thức nào, đồng thời đủ đóng để sau khi lấy thứ cần thiết, không ai có thể rời đi
- Salesforce năm nay đã chặn dữ liệu Slack khỏi Glean và các agent bên ngoài, trường hợp đầu tiên làm công khai
- Con đường xây công ty bền vững là tách bạch
- Cho phép agent đọc, vì đọc rẻ và dù sao cũng quan trọng
- Bảo vệ thao tác ghi
- Điểm nơi phán đoán mới được nhập vào, nơi con người và agent phê duyệt, chỉnh sửa và quay lui lẫn nhau, là phần đối thủ khó chuyển đi
- Thứ họ scrape được là trạng thái của ngày hôm qua; chỉ các quyết định đang được đưa ra ngay lúc này mới còn là của riêng bạn
“Nếu Anthropic làm ra thứ này thì sao?”
- Có thể phản biện rằng các Lab đã nằm trong dòng token rồi, vậy hào lũy ở đâu
- Claude Code nhìn thấy mọi lệnh lập trình viên chạy và mọi đề xuất bị bỏ qua, ChatGPT quan sát nhiều quyết định trong một ngày hơn một sản phẩm ghi lại trong một năm
- Câu trả lời cho phản biện: những gì công cụ của họ thấy phần lớn là generic
- Cùng một kiểu coding và writing mà mọi mô hình đều thấy, chính thứ mà các lab đang cạnh tranh để commoditize lẫn nhau
- Phán đoán hiếm nằm sâu trong từng công ty — cách bệnh viện đọc scan, những thương vụ công ty đã học được là nên walk away, không thứ nào chạm tới chatbox của lab
- Các Lab đã nói với doanh nghiệp suốt nhiều năm rằng họ không huấn luyện bằng dữ liệu của doanh nghiệp
- Tri thức ngầm đi qua mô hình bên trong sản phẩm được giữ lại cho chính sản phẩm bằng hợp đồng; họ thấy trace đi qua nhưng đã đồng ý không lưu trữ
- Nửa fintech là thứ lab cũng không muốn
- Lab sẵn sàng lấy dữ liệu, nhưng loan book, tổn thất gian lận, giấy phép money-transmitter ở 40 bang thì vô dụng với họ
- Với người mua, dữ liệu tạo ra giá trị để thâu tóm, còn fintech khiến việc tách ra trở nên khó khăn
- Cursor đã xây dựng cỗ máy dữ liệu tốt nhất trong hạng mục và được một lab mua với giá 60 tỷ USD
- Đó là giấc mơ hay lời cảnh báo thì bạn sẽ không biết cho đến khi đã quá muộn để thay đổi
- Hãy xây hai thứ có thể sống sót — tích lũy phán đoán và ngồi ở yết hầu của dòng tiền; đó là cách chịu được câu hỏi “Nếu Anthropic làm ra thứ này thì sao?”
2 bình luận
Nghe có vẻ hợp lý đấy, nhưng khó hiểu ghê.
Việc tích lũy các phán đoán, kiểm soát dòng tiền, và bảo vệ các thao tác ghi (writes) là con đường duy nhất để một công ty vẫn không thể bị thay thế ngay cả khi lab nhìn thấy mọi token -> ý nghĩa của câu này hơi mơ hồ; có thể giải thích thêm được không?