5 điểm bởi GN⁺ 2 giờ trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Sự kết thúc của kỷ nguyên phần mềm cũng là khởi đầu của kỷ nguyên harness, khi SaaS vận hành bằng workflow cố định và cơ sở dữ liệu được quản lý đang dần được thay thế bởi AI có trí tuệ
  • AI rất mạnh mẽ nhưng vẫn như ngựa hoang chưa được thuần hóa, và để khai thác sức mạnh đó cần có sự kiểm soát có hệ thống (domestication)
  • Harness cho AI agent được định nghĩa bởi 7 thành phần cốt lõi bao quanh LLM ở trung tâm, và mỗi thành phần quyết định độ tin cậy cũng như hiệu năng ở mức production
  • Trong thời đại mọi công ty đều có thể tiếp cận cùng một mô hình, bên chiến thắng không phải là bản thân mô hình mà là người thiết kế và vận hành harness tốt hơn (best rider)
  • Hàng nghìn thị trường tách biệt mà các big lab không ưu tiên vẫn là cơ hội còn lại cho startup

Ý nghĩa của kỷ nguyên harness

  • AI đang thay thế các SaaS dựa trên workflow cố định và cơ sở dữ liệu được quản lý bằng trí tuệ (intelligence), qua đó tái định nghĩa mô hình phần mềm
  • AI được ví như một con mustang, mạnh mẽ nhưng thô ráp nên không thể dùng nguyên trạng, và quá trình thuần hóa đó chính là harness
  • Bản chất của việc thuần hóa là một kiến trúc đặt LLM ở trung tâm và bố trí 7 thành phần xung quanh theo dạng tỏa tròn

7 thành phần của harness cho AI agent

  • 1. Context & Memory (ngữ cảnh và bộ nhớ)

    • Mô hình đa dụng cần truy xuất tùy biến theo từng mục đích sử dụng (bespoke retrieval); hệ thống truy xuất ngữ cảnh cho bác sĩ chẩn đoán hình ảnh không thể giống với hệ thống dành cho trợ lý pháp lý
    • Bộ nhớ ngắn hạn ("agent đã làm gì cách đây 45 giây"), truy xuất ảnh quy mô lớn (chẩn đoán hình ảnh/tạo ảnh), tìm kiếm từ khóa trên hàng tỷ tài liệu... hệ thống sẽ khác nhau tùy từng trường hợp
    • Bên cạnh lớp truy xuất là cơ sở dữ liệu ngữ cảnh, đóng vai trò như một "sách công thức" ghi lại cách doanh nghiệp thực sự vận hành
      • Các quy trình vận hành chuẩn (SOP) mà mọi người mang trong đầu khi đi làm chính là những công thức đó
      • Việc ghi nhận ban đầu và sự tiến hóa theo thay đổi của con người và quy trình là bản chất của cơ sở dữ liệu ngữ cảnh
  • 2. Tools & Action (công cụ và hành động)

    • Công cụ là phương tiện để agent tác động lên thế giới bên ngoài; nếu công thức trong cơ sở dữ liệu ngữ cảnh cho biết "cần làm gì", thì công cụ là nguyên liệu và dụng cụ để thực sự thực hiện điều đó
    • Harness hiện đại phơi bày công cụ qua một registry, xác thực các tham số do mô hình truyền vào, điều phối lời gọi, cho các tác vụ nhạy cảm đi qua cổng phê duyệt, rồi phân tích kết quả đưa lại vào vòng lặp của agent
    • MCP đang nổi lên như lớp kết nối (connective tissue) cho việc liên kết công cụ
    • Chất lượng của harness được quyết định bởi số lượng công cụ có thể phơi bày một cách an toàn và khả năng xử lý lỗi gọn gàng
  • 3. Orchestration & Loop (điều phối và vòng lặp)

    • Vòng lặp của agent có cấu trúc think → act → observe → repeat
    • Việc lập kế hoạch, phân rã tác vụ, sub-agent, cơ chế retry và điều kiện dừng sẽ quy định cách công việc được thực thi
    • Hệ thống phải cải thiện dần theo quá trình sử dụng, và mô hình vòng lặp khép kín học hỏi từ mỗi lần chạy sẽ là yếu tố tạo khác biệt giữa các nhà cung cấp
  • 4. State & Persistence (trạng thái và tính bền vững)

    • Trong các doanh nghiệp lớn nơi nhiều người cùng lúc sử dụng hệ thống, khả năng phục hồi (resilient) là bắt buộc
    • Nếu harness bị crash ở bước 7 của một quy trình 10 bước thì nó phải tiếp tục từ bước 8, thay vì chạy lại từ đầu
    • Hệ thống tệp, checkpoint, session thread và kho lưu trữ artifact là các cơ chế giúp tránh mất việc đang làm
  • 5. Sandbox & Compute (sandbox và tính toán)

    • Mỗi agent cần một không gian làm việc độc lập (sandbox)
    • Workspace Unix cô lập, lưu lượng mạng ra ngoài (egress) được kiểm soát, và credentials được lưu bên ngoài mô hình giúp bảo đảm an toàn, tính bảo mật và tốc độ ở quy mô lớn
  • 6. Observability & Governance (khả năng quan sát và quản trị)

    • "Không nhìn thấy thì không thể tin tưởng" - theo dõi mọi bước, ghi log mọi lời gọi công cụ, chạy evals như kiểm thử hồi quy, và có con người trong vòng lặp (human-in-the-loop) cho các quyết định rủi ro cao sẽ biến bản demo thành hệ thống production
    • Guardrails dùng để cưỡng chế chính sách, còn Evals giúp phát hiện hồi quy trước cả khách hàng
  • 7. Cost & Workflow Optimization (tối ưu chi phí và workflow)

    • Thành phần thứ bảy là năng lực phán đoán về mặt kiến trúc (architectural judgment)
    • Cần phân định phần nào nên xử lý theo kiểu quyết định (deterministic) hay không quyết định (non-deterministic), chọn mô hình phù hợp cho từng bước (state-of-the-art, cỡ trung, cỡ nhỏ, fine-tuned), và quyết định nên đặt tri thức trong skill hay trong bộ nhớ

Cục diện cạnh tranh mới

  • Kết quả là một động lực cạnh tranh mới của phần mềm, nhưng không áp dụng giống nhau cho mọi danh mục
  • Những thị trường mà các major lab (viện nghiên cứu AI lớn) ưu tiên sẽ hưởng lợi từ khả năng thực thi nhanh và quyền kiểm soát trực tiếp mô hình
  • Nhưng ngoài ra vẫn còn hàng nghìn thị trường riêng biệt mở ra cho startup
  • Trong thời đại mọi công ty đều có thể sử dụng cùng một mô hình, "những người cưỡi giỏi nhất (best riders)" sẽ chiến thắng - tức năng lực thiết kế và vận hành harness mới là lợi thế cạnh tranh cốt lõi

Chưa có bình luận nào.

Chưa có bình luận nào.