5 điểm bởi GN⁺ 2026-02-06 | 1 bình luận | Chia sẻ qua WhatsApp
  • Với startup AI, trước độ phù hợp sản phẩm-thị trường (PMF), việc xác nhận độ phù hợp mô hình-thị trường (MMF) — tức liệu năng lực của mô hình hiện tại có thực sự giải quyết được nhu cầu của thị trường hay không — là điều bắt buộc
  • Sau khi GPT-4 ra mắt, thị trường AI pháp lý tăng trưởng bùng nổ; sau khi Claude 3.5 Sonnet ra mắt, các trợ lý lập trình trở thành một phần thực sự của quy trình làm việc là những ví dụ tiêu biểu cho việc đạt được MMF
  • Các lĩnh vực như chứng minh toán học, phân tích tài chính rủi ro cao, phát triển thuốc tự động vẫn có nhu cầu thị trường, nhưng năng lực mô hình chưa vượt qua ngưỡng tới hạn, nên MMF vẫn chưa tồn tại
  • Nếu Human-in-the-loop không còn là phương tiện hỗ trợ mà con người phải trực tiếp làm thay phần việc cốt lõi thay vì chỉ bổ trợ, có thể hiểu là MMF chưa tồn tại
  • Trọng tâm của chiến lược AI là nhận thức được trình tự MMF → PMF → thành công và tỉnh táo phán đoán nên xây gì, khi nào

Khung tư duy của Marc Andreessen và biến số mới

  • Năm 2007, Marc Andreessen công bố một bài luận cho rằng trong ba yếu tố của startup (đội ngũ, sản phẩm, thị trường), thị trường là quan trọng nhất
    • Một thị trường tốt sẽ kéo sản phẩm ra khỏi startup; sản phẩm không cần phải xuất sắc, chỉ cần về cơ bản là hoạt động được là đủ
  • Sau 19 năm, đã xuất hiện một biến số mới quyết định liệu thị trường có thể thực sự kéo được thứ gì đó hay không: mô hình
  • Với startup AI, trước độ phù hợp sản phẩm-thị trường còn tồn tại một điều kiện tiên quyết: năng lực của mô hình hiện tại có thể thực hiện công việc mà thị trường đòi hỏi hay không
  • Khi MMF tồn tại, khung tư duy của Andreessen mới vận hành và thị trường kéo sản phẩm đi; nếu không, dù UX, chiến lược GTM hay kỹ thuật có xuất sắc đến đâu cũng không thể dẫn tới việc khách hàng chấp nhận

Những vụ bùng nổ thị trường khi MMF được khai mở

  • AI pháp lý: GPT-4 (tháng 3/2023)

    • Trước GPT-4, AI legal tech không thể mở rộng quy mô; các công cụ rà soát tài liệu đòi hỏi nhiều giám sát của con người hơn cả phần tiết kiệm chúng tạo ra
    • Các mô hình transformer trước đó như BERT mạnh ở các tác vụ phân loại như phân loại tài liệu hay nhận diện loại hợp đồng, nhưng không thể làm tạo sinh và suy luận — vốn là cốt lõi của công việc pháp lý
      • Chúng có thể phân loại hợp đồng là “employment” hay “NDA”, nhưng không thể viết một bản tóm lược nhất quán giải thích vì sao điều khoản không cạnh tranh lại không thể được thi hành theo luật California
    • Trong 18 tháng sau khi GPT-4 ra mắt, các startup ở Silicon Valley huy động được hàng trăm triệu USD; Thomson Reuters đã mua lại Casetext với giá 650 triệu USD, và hàng chục startup AI pháp lý mới xuất hiện
    • Thị trường AI pháp lý đã tạo ra nhiều unicorn hơn chỉ trong 12 tháng so với cả 10 năm trước đó cộng lại
    • Nhu cầu thị trường vẫn như cũ; điều thay đổi duy nhất là năng lực mô hình đã vượt ngưỡng tới hạn
  • Lập trình: Claude 3.5 Sonnet (tháng 6/2024)

    • Các trợ lý lập trình như GitHub Copilot đã tồn tại từ trước, nhưng có một khác biệt rõ ràng giữa tính năng tự động hoàn thành đôi lúc hữu ích và AI thực sự hiểu codebase
    • Khi dùng Cursor trước Claude 3.5 Sonnet, trải nghiệm chỉ dừng ở mức demo thú vị và không trở thành một phần của quy trình làm việc hằng ngày
    • Sau khi Sonnet ra mắt, chỉ trong một tuần đã trở nên không thể làm việc nếu thiếu Cursor; trải nghiệm chuyển thành pair programming với một thực thể hiểu toàn bộ codebase
    • Lý do tăng trưởng của Cursor diễn ra theo phương thẳng đứng không phải vì đổi mới tính năng, mà vì mô hình nền tảng đã vượt qua ngưỡng đủ dùng trong thực tế
  • Phân tích mẫu hình

    • Cốt lõi là MMF có tồn tại hay không; những startup chiến thắng không phải lúc nào cũng là người đến đầu tiên, mà là những đội ngũ đã sẵn sàng cho thời điểm năng lực mô hình vượt ngưỡng
    • Ở cả lập trình lẫn pháp lý, không có trường hợp người chơi sẵn có thắng cuộc; luôn là người chơi mới chiếm lĩnh thị trường
    • Các startup AI pháp lý đang dẫn đầu hiện nay đã tích lũy trước đó trong nhiều tháng về quy trình làm việc thực tế của luật sư, định dạng đầu ra cần thiết, yêu cầu pháp lý và cách các associate nghiên cứu
    • Thắng thua không thuộc về người đi trước, mà thuộc về bên đạt PMF đầu tiên sau khi MMF đã hình thành

Những vấn đề xảy ra khi MMF chưa tồn tại

  • Chứng minh toán học

    • Các nhà toán học muốn có AI có thể chứng minh các định lý mới; các viện nghiên cứu, nhà thầu quốc phòng và công ty công nghệ sẵn sàng trả hàng triệu USD cho suy luận toán học thực sự
    • Nhưng ngay cả những mô hình tiên tiến nhất cũng không thể làm điều đó một cách nhất quán, mà chỉ dừng ở việc kiểm chứng chứng minh đã biết, hỗ trợ các bước máy móc hoặc cung cấp gợi ý cho các bài toán hạn chế
    • Việc tạo ra chứng minh mới cho các bài toán mở hiện vẫn là bất khả; dù đã có cải thiện dần qua các thế hệ như GPT-5, o1, o3, nhưng chưa đến mức có thể kỳ vọng chứng minh chặt chẽ cho các giả thuyết mở
  • Tài chính rủi ro cao

    • Các ngân hàng đầu tư và hedge fund rất muốn có AI thực hiện phân tích tài chính toàn diện; chỉ một thương vụ thành công hay một thương vụ M&A cũng có thể tạo ra hàng trăm triệu USD phí
    • Tuy nhiên, ở các tác vụ cốt lõi, AI vẫn cho thấy hiệu năng thấp đến mức đáng kinh ngạc
      • Khi xử lý các mô hình tài chính phức tạp, ngay cả đầu ra Excel cũng khó có thể tin cậy
      • Việc đọc tài liệu dài 200 trang rồi kết hợp phân tích định lượng với insight định tính là một trong những trở ngại lớn nhất đối với AI
    • Các nhà phân tích con người đọc earnings call, hồ sơ công bố với cơ quan quản lý và báo cáo ngành, rồi tổng hợp chúng vào mô hình bảng tính để đưa ra quyết định đầu tư; AI hiện chỉ xử lý được một phần của quy trình này
    • Lý do con người vẫn phải ở trong vòng lặp không phải để giám sát, mà vì họ vẫn cần đóng vai trò là người ra quyết định cốt lõi
  • Khoảng cách benchmark

    • Kết quả so sánh benchmark của Vals.ai cho thấy khoảng cách hiệu năng giữa các vertical có MMF và không có MMF là rất rõ rệt
    • LegalBench (tác vụ suy luận pháp lý): mô hình tốt nhất đạt độ chính xác 87%, Gemini 3 Pro dẫn đầu với 87,04%, và nhiều mô hình khác cũng đạt trên 85%
      • Hiệu năng ở mức production đủ để luật sư có thể tin đầu ra chỉ sau khi rà soát nhẹ
    • Finance Agent (các tác vụ cốt lõi của nhà phân tích tài chính): mô hình tốt nhất chỉ đạt 56,55% độ chính xác, GPT-5.1 chỉ vừa vượt qua một nửa, còn Claude Sonnet 4.5 extended thinking đạt 55,32%
    • Khoảng 30 điểm phần trăm chênh lệch cho thấy MMF tồn tại trong pháp lý nhưng chưa tồn tại trong tài chính
    • Ngày nay có thể ra mắt sản phẩm AI pháp lý, nhưng sản phẩm AI tài chính làm được công việc thực sự của nhà phân tích thì dù có thể sắp thành hiện thực, hiện tại vẫn chưa làm được
  • Phát triển thuốc tự động

    • Ngành dược đang đầu tư hàng tỷ USD vào phát triển thuốc dựa trên AI; một loại thuốc thành công duy nhất có thể đáng giá hàng chục tỷ USD
    • AI đang giúp tăng tốc từng công đoạn riêng lẻ như xác định phân tử ứng viên, dự đoán cấu trúc protein (bước đột phá của AlphaFold), tối ưu thiết kế thử nghiệm lâm sàng
    • Tuy nhiên, vẫn chưa tồn tại quy trình khám phá thuốc tự động end-to-end đủ để biện minh cho các mức định giá hiện tại
    • Lý do con người vẫn ở trong vòng lặp không phải là lựa chọn thiết kế workflow, mà vì AI vẫn chưa thể thực hiện công việc thực sự

Cách nhận diện khi MMF chưa tồn tại

  • Tín hiệu đáng tin cậy nhất để ước lượng việc thiếu MMF là xem Human-in-the-loop đang được bố trí với vai trò gì
  • Khi MMF tồn tại, Human-in-the-loop hoạt động như một tính năng, đảm nhận việc duy trì chất lượng, xây dựng lòng tin và xử lý edge case
    • AI thực hiện công việc cốt lõi, còn con người cung cấp sự giám sát và phê duyệt
  • Khi MMF không tồn tại, Human-in-the-loop gần giống một chiếc nạng, che giấu thực tế rằng AI không thể làm công việc cốt lõi
    • Con người không được tăng cường năng lực mà đang làm phần bù đắp, và nếu loại bỏ con người thì sản phẩm lập tức không hoạt động
  • Một tiêu chí phán đoán đơn giản: nếu loại bỏ mọi chỉnh sửa của con người khỏi workflow này, khách hàng còn sẵn sàng trả tiền không?
    • Nếu câu trả lời là không, thì MMF chưa tồn tại; thứ còn lại chỉ là demo

Thế lưỡng nan chiến lược: xây cho hiện tại hay xây cho tương lai?

  • Lập luận cho việc chờ đợi

    • Xây startup trong bối cảnh hiện chưa có MMF đồng nghĩa với việc đặt cược vào các cải tiến mô hình nằm trong roadmap của người khác
    • Không thể kiểm soát khi nào năng lực đó sẽ xuất hiện, trong khi runway vẫn tiếp tục bị đốt trong lúc Anthropic và OpenAI đưa ra quyết định
    • Cũng có khả năng đánh giá sai chính năng lực cần thiết
      • Khoảng cách giữa 80% và 99% độ chính xác mà vertical đó yêu cầu có thể chỉ được thu hẹp sau 5 năm, hoặc có thể không bao giờ được thu hẹp theo cách đã giả định
    • Nếu tin vào AGI, có thể rồi mô hình sẽ làm được gần như mọi việc, nhưng vấn đề cốt lõi không phải là khả năng mà là thời điểm
      • Câu hỏi không phải AI có giải được bài toán hay không, mà là đến lúc đó startup còn sống sót hay không; và đó chính là bài toán runway
  • Lập luận cho việc bắt đầu sớm

    • Có một phản biện thường được nhắc đến ở Y Combinator, và nó khá thuyết phục
    • Khi MMF được khai mở, thứ cần thiết không chỉ là năng lực mô hình
      • pipeline dữ liệu đặc thù theo domain
      • mối quan hệ với cơ quan quản lý
      • niềm tin khách hàng được bồi đắp qua nhiều năm
      • workflow tích hợp sâu
      • hiểu biết về cách chuyên gia thực sự làm việc
    • Các startup pháp lý không chỉ đơn giản gắn GPT-4 vào, mà đã xây sẵn scaffolding từ trước, nên khi mô hình xuất hiện là có thể triển khai ngay
    • Những đội ngũ gần bài toán nhất có ảnh hưởng trực tiếp tới tiêu chí đánh giá mô hình, hướng fine-tuning và cách triển khai
      • Họ không thụ động chờ năng lực đến, mà góp phần định nghĩa điều gì mới được xem là năng lực trong vertical đó
  • Lời giải

    • Câu hỏi cốt lõi không phải có nên bắt đầu sớm hay không, mà là bắt đầu sớm đến mức nào, và trong lúc chờ đợi thì nên xây gì
    • Khoảng nguy hiểm nhất là vùng trung gian
      • trạng thái mà MMF có vẻ sẽ đạt được sau 24–36 tháng
      • đủ gần để tạo cảm giác sắp đến nơi, nhưng cũng đủ xa để tiêu tốn vài vòng gọi vốn
    • Trong vùng này, niềm tin và runway quyết định tất cả
      • Nếu đặt cược vào MMF của hơn 2 năm sau, thì đó phải là một thị trường cực lớn xứng đáng để chờ
    • Y tế và dịch vụ tài chính là các thị trường nghìn tỷ USD mà Anthropic và OpenAI đang all-in, dù kết quả hiện tại còn trái chiều
      • Biên độ tăng trưởng tiềm năng đủ lớn nên việc định vị sớm là hợp lý
    • Công thức đánh giá rất đơn giản
      giá trị kỳ vọng = xác suất MMF xuất hiện × quy mô thị trường × thị phần kỳ vọng

Cách đo MMF

  • Độ phù hợp sản phẩm-thị trường vốn nổi tiếng là khó đo chính xác, và Andreessen từng mô tả nó theo cách định tính
    • “Khi PMF chưa xảy ra, bạn luôn cảm nhận được; và khi nó xảy ra, bạn cũng luôn cảm nhận được
  • MMF cũng là một khái niệm mang tính trực giác về bản chất, nhưng có thể được cụ thể hóa bằng các tiêu chí rõ ràng hơn
  • Bài kiểm tra MMF

    • Câu hỏi trọng tâm: khi mô hình nhận cùng đầu vào với chuyên gia con người, liệu nó có thể tạo ra đầu ra khiến khách hàng sẵn sàng trả tiền mà không cần chỉnh sửa đáng kể từ con người hay không
    • Ba thành phần cấu thành
      • 1. Cùng đầu vào
        • Mô hình phải dùng cùng tài liệu, dữ liệu và bối cảnh mà con người nhận được làm đầu vào
        • Không được phép có những bước tiền xử lý “ma thuật” mà workflow thực tế không thể cung cấp
      • 2. Đầu ra khách hàng sẵn sàng trả tiền
        • Không phải demo hay proof-of-concept, mà là kết quả chất lượng production giải quyết được vấn đề thực tế
      • 3. Không cần chỉnh sửa đáng kể từ con người
        • Con người có thể rà soát, sửa và phê duyệt, nhưng nếu phải viết lại 50% đầu ra thì khó có thể nói mô hình đang thực sự làm việc
  • Khoảng cách 80/99

    • Ở các vertical không bị quản lý chặt, đôi khi độ chính xác 80% đã đủ
      • Ví dụ AI viết bản nháp marketing copy vẫn có thể tạo giá trị dù con người phải biên tập nhiều
    • Nhưng ở các vertical có quy định nghiêm ngặt (tài chính, pháp lý, y tế), độ chính xác 80% gần như vô dụng
      • Công cụ rà soát hợp đồng bỏ sót 20% điều khoản cốt lõi không giúp luật sư mà còn tạo ra trách nhiệm pháp lý
      • Một chẩn đoán y tế sai 1 trong 5 lần không phải là sản phẩm mà là rủi ro kiện tụng
    • Khoảng cách giữa 80% và 99% độ chính xác trong thực tế thường gần như là vô hạn
      • Đó là ranh giới quyết định giữa “demo đầy hứa hẹn” và “hệ thống production”
    • Rất nhiều startup AI đang mắc kẹt trong khoảng cách này: gọi vốn bằng demo trong lúc chờ năng lực giúp sản phẩm thực sự hoạt động xuất hiện

Ngưỡng tác tử

  • Một frontier năng lực thứ hai thường bị bỏ qua trong phần lớn thảo luận về MMF là khả năng làm việc tự chủ trong thời gian dài
  • Những trường hợp MMF đã hình thành hiện nay (rà soát tài liệu pháp lý, hỗ trợ lập trình) về bản chất là các tác vụ có chân trời thời gian ngắn
    • Nhập prompt, nhận đầu ra, gọi vài công cụ và tạo kết quả hữu ích trong vài giây hoặc vài phút
  • Nhưng những công việc tri thức có giá trị cao nhất lại không vận hành như vậy
    • Nhà phân tích tài chính không chỉ trả lời một câu hỏi, mà xây mô hình trong nhiều ngày, stress test các giả định và tổng hợp thông tin từ hàng chục nguồn
    • Chuyên gia tư vấn chiến lược không chỉ làm một slide mà lặp đi lặp lại nhiều tuần nghiên cứu, phỏng vấn và phân tích
    • Nhà nghiên cứu phát triển thuốc không chỉ làm một thí nghiệm mà thiết kế và thực hiện chiến dịch kéo dài hàng tháng
  • Những workflow này đòi hỏi các năng lực mà mô hình hiện vẫn chưa thể thực hiện một cách đáng tin cậy, và cốt lõi của chúng là vận hành tự chủ liên tục
  • Ngưỡng tác tử không chỉ là chuyện “có dùng được công cụ hay không”
    • Tính bền bỉ: có thể duy trì mục tiêu và bối cảnh trong nhiều giờ hoặc nhiều ngày không
    • Khả năng phục hồi: có thể nhận ra thất bại, chẩn đoán nguyên nhân rồi thử cách tiếp cận khác không
    • Khả năng điều phối: có thể chia mục tiêu phức tạp thành các tác vụ con rồi thực hiện tuần tự không
    • Phán đoán: có thể phân biệt khi nào nên tiếp tục và khi nào nên dừng để xin chỉ dẫn từ con người không
  • Các agent ngày nay có thể xử lý các tác vụ tính bằng phút, nhưng lớp agent tiếp theo phải đảm nhận các tác vụ tính bằng ngày
    • Đây không phải là cải thiện hiệu năng dần dần mà là sự thay đổi về bản chất của chính năng lực
  • Đây cũng là lý do tài chính vẫn chưa có MMF dù được đánh giá là “đọc tài liệu tốt”
    • Đọc một bản 10-K là tác vụ 30 giây, nhưng xây dựng luận điểm đầu tư là workflow kéo dài nhiều ngày
    • Nó đòi hỏi phải duy trì suy luận nhất quán xuyên suốt quá trình thu thập dữ liệu, xây mô hình, kiểm tra kịch bản và tổng hợp kết luận
  • Làn sóng khai mở MMF tiếp theo sẽ bắt đầu không chỉ từ các mô hình thông minh hơn, mà từ các mô hình có thể tự chủ làm cùng một công việc trong nhiều ngày

Những điểm cốt lõi mang tính cấu trúc

  • Insight cốt lõi của Andreessen là thị trường quan trọng hơn đội ngũ hay sản phẩm vì một thị trường tốt sẽ kéo sản phẩm ra khỏi startup
  • Hệ quả tất yếu trong AI là điều kiện tiên quyết để lực hút đó bắt đầu chính là năng lực mô hình
  • Dù thị trường có lớn và khao khát đến đâu, nó cũng không thể kéo một sản phẩm không hoạt động
    • Trong AI, tiêu chuẩn của “không hoạt động” không do kỹ thuật hay thiết kế quyết định, mà do chính mô hình quyết định
    • Dù có giao diện đẹp nhất, workflow thanh lịch nhất hay pipeline dữ liệu tinh vi nhất, nếu mô hình nền tảng không làm được công việc cốt lõi thì mọi thứ đều vô nghĩa
  • Nếu bỏ qua trình tự MMF → PMF → thành công, thì bước thứ hai sẽ không thể hình thành
  • Với nhà sáng lập, điều này có nghĩa là phải thẳng thắn đến tàn nhẫn trong việc phân biệt năng lực hiện thực đã đi tới đâu với nơi mình mong nó đang ở
  • Với nhà đầu tư, điều này có nghĩa là không chỉ đánh giá quy mô thị trường và chất lượng đội ngũ, mà còn phải đánh giá khoảng cách giữa năng lực mô hình hiện tại và yêu cầu của thị trường
  • Với bất kỳ ai xây dựng AI, câu hỏi còn lại không phải là thị trường có muốn nó hay không, mà là mô hình có thực sự cung cấp được nó hay không
  • Đó là điều duy nhất quan trọng

1 bình luận

 
xguru 2026-02-06

Phần mềm Sinh tồn 3.0 – Phải làm gì để sống sót
Mấy ngày gần đây thường xuyên thấy các bài viết về việc phải sống sót như thế nào.