18 điểm bởi GN⁺ 2026-02-23 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Kỹ thuật phần mềm chiếm khoảng 50% tổng số lần gọi công cụ của AI agent, trong khi 16 mảng dọc như y tế, pháp lý, tài chính đều chỉ dưới 5% mỗi lĩnh vực
  • Năng lực thực tế của mô hình AI đã đạt mức có thể thực hiện các công việc mà con người mất 5 giờ, nhưng trong sử dụng thực tế, phiên ở bách phân vị 99,9 chỉ kéo dài khoảng 42 phút, cho thấy khoảng cách lớn giữa năng lực và độ tin cậy
  • Khi trải nghiệm người dùng tích lũy nhiều hơn, tỷ lệ phê duyệt tự động tăng từ 20% lên hơn 40%, đồng thời người dùng thành thạo chuyển chiến lược giám sát từ phê duyệt trước sang theo dõi chủ động
  • Cốt lõi của AI theo ngành dọc là tích hợp dữ liệu độc quyền, context engineering chuyên biệt theo miền, quản lý thay đổi của khách hàng, và đây là tiêu chí phân biệt giữa wrapper đơn thuần với doanh nghiệp có lợi thế phòng thủ
  • Giống như SaaS đã tạo ra hơn 170 unicorn trong vài thập kỷ qua, rất có thể sẽ xuất hiện các unicorn AI theo ngành dọc tương ứng với từng unicorn SaaS, và phiên bản AI có thể thay thế không chỉ phần mềm mà cả nhân sự vận hành

Kỹ thuật phần mềm chiếm một nửa hoạt động của AI agent

  • Theo nghiên cứu về mức sử dụng thực tế của AI agent do Anthropic công bố, kỹ thuật phần mềm chiếm 49,7% tổng số lần gọi công cụ theo kiểu agentic
  • Y tế chỉ chiếm 1%, pháp lý 0,9%, giáo dục 1,8%, và trong 16 mảng dọc không có lĩnh vực nào vượt quá 9%
  • Điều này không có nghĩa thị trường đã bão hòa, mà là vẫn chưa thực sự hình thành
  • Han Wang gọi đây là “cơ hội greenfield mà phần lớn startup founder bỏ qua”
  • Tác giả bài viết này, Garry Tan, nói rằng “nếu khởi nghiệp ngay lúc này, tôi sẽ chú ý đến vùng màu đỏ trong biểu đồ này

Deployment overhang

  • Theo đánh giá METR, mô hình Claude có thể thực hiện những công việc mà con người mất 5 giờ, nhưng phiên thực tế trung bình chỉ kéo dài 42 phút
  • Khoảng cách giữa những gì AI có thể làm và những gì người dùng cho phép tạo ra một cơ hội rất lớn
  • Từ tháng 10/2025 đến tháng 1/2026, thời lượng turn ở bách phân vị 99,9 gần như tăng gấp đôi, từ dưới 25 phút lên hơn 45 phút
    • Điều này phản ánh không chỉ hiệu năng mô hình được cải thiện mà còn việc người dùng tích lũy niềm tin qua từng phiên
  • Trong dữ liệu nội bộ, tỷ lệ thành công của Claude Code tăng gấp đôi, còn số lần con người can thiệp mỗi phiên giảm từ 5,4 xuống 3,3
  • Năng lực của mô hình đã đủ, nhưng triển khai chưa theo kịp, và đây chính là cơ hội cho sản phẩm mới

Niềm tin tiến hóa như thế nào

  • Người dùng mới chỉ phê duyệt tự động 20% phiên Claude Code, nhưng sau 750 phiên trải nghiệm, hơn 40% chuyển sang phê duyệt hoàn toàn tự động
  • Trái với trực giác, người dùng thành thạo không phải can thiệp ít hơn mà là can thiệp nhiều hơn — tỷ lệ can thiệp của người mới là 5%, còn người dùng thành thạo là 9%
    • Đây không phải mâu thuẫn mà là sự thay đổi trong chiến lược giám sát (oversight): người mới phê duyệt trước từng bước, còn người dùng thành thạo ủy quyền trước rồi chỉ can thiệp khi có vấn đề (từ phê duyệt trước → theo dõi chủ động)
  • Phát hiện liên quan đến an toàn: trong các tác vụ phức tạp, Claude Code đặt câu hỏi xác nhận thường xuyên hơn hơn gấp đôi so với tần suất con người can thiệp
    • Tức là agent không lao tới một cách mù quáng mà có xu hướng tự dừng lại khi bất định
  • Bài học cốt lõi từ Anthropic: mức độ tự chủ mà agent thực sự thể hiện là thứ được đồng kiến tạo bởi mô hình, người dùng và sản phẩm

Playbook AI theo ngành dọc của Aaron Levie

  • Công thức xây dựng AI theo ngành dọc mà Aaron Levie đưa ra:
    • Hiểu dữ liệu, workflow và rào cản pháp lý đặc thù của từng ngành là cốt lõi để xây dựng doanh nghiệp có khả năng phòng thủ cao
    • Cần năng lực tích hợp dữ liệu riêng, tự động hóa workflow, quản lý thay đổi, chứ không chỉ là một wrapper đơn giản
    • Xây dựng phần mềm agentic kết nối với dữ liệu độc quyền
    • Thiết kế để phần mềm vận hành phù hợp với con người thật và vấn đề thật
    • Tối đa hóa trí thông minh đầu ra bằng context engineering chuyên biệt theo miền
    • Phần lớn founder bỏ lỡ một điểm: thúc đẩy quản lý thay đổi (change management) cho khách hàng
  • Lý do AI theo ngành dọc có tính phòng thủ: ai cũng có thể làm wrapper, nhưng rất ít bên có thể điều hướng workflow cụ thể, ràng buộc pháp lý, ma sát tổ chức như thanh toán bảo hiểm y tế, legal discovery hay cấp phép xây dựng
  • SaaS đã tăng trưởng gấp 10 lần mỗi thập kỷ trong nhiều thập kỷ, hơn 40% vốn đầu tư VC trong 20 năm qua tập trung vào SaaS, và đã tạo ra hơn 170 unicorn SaaS
  • Luận điểm cốt lõi: với mỗi unicorn SaaS sẽ có một unicorn AI theo ngành dọc tương ứng, và phiên bản AI có thể lớn hơn 10 lần vì nó thay thế không chỉ phần mềm mà cả nhân sự vận hành

Insight về đồng kiến tạo và hàm ý chính sách

  • Phát hiện cốt lõi của Anthropic:
    • Tự chủ không phải thuộc tính vốn có của mô hình mà là thứ được đồng kiến tạo bởi mô hình, người dùng và sản phẩm, và
    • Không thể nắm bắt điều này chỉ bằng đánh giá trước triển khai, nên đo lường trong môi trường thực tế là điều bắt buộc
  • Các chỉ số an toàn: 73% số lần gọi công cụ có con người can thiệp, chỉ 0,8% được phân loại là hành động không thể đảo ngược
    • Những cách triển khai rủi ro nhất (lộ API key, giao dịch crypto tự động...) phần lớn là đánh giá bảo mật, không phải production thực tế
  • Chính sách kiểu “hãy phê duyệt mọi hành động” chỉ làm giảm năng suất mà không cải thiện an toàn,
    mục tiêu chính sách tốt hơn là bảo đảm con người có thể theo dõi và can thiệp

Nơi các unicorn đang ẩn mình

  • Kỹ thuật phần mềm đã là khu vực bị chiếm trước, còn y tế, pháp lý, tài chính, giáo dục, dịch vụ khách hàng, logistics...
    16 mảng dọc với thị phần một chữ số đang chờ ai đó nhúng chuyên môn miền vào agent
  • Trước đây đã có 300 unicorn SaaS ra đời, và tiếp theo sẽ là 300 unicorn AI theo ngành dọc
  • Những founder chọn đúng mảng dọc, nhúng chuyên môn miền vào agent và giải được bài toán quản lý thay đổi sẽ sở hữu phần mềm doanh nghiệp của 10 năm tới
  • Mô hình đã có thể làm việc suốt 5 giờ nhưng người dùng chỉ cho phép 42 phút
    • Điều này cho thấy chúng ta vẫn đang ở giai đoạn đầu của việc ứng dụng AI, và
    • Gợi ý rằng vẫn còn rất nhiều lĩnh vực chưa được áp dụng dù chỉ 1 phút trí tuệ

Chưa có bình luận nào.

Chưa có bình luận nào.