Phần mềm sau AI: Khởi đầu của kỷ nguyên harness

(tomtunguz.com)

43 điểm bởi GN⁺ 2026-06-01 | 9 bình luận | Chia sẻ qua WhatsApp

Sự kết thúc của kỷ nguyên phần mềm cũng là khởi đầu của kỷ nguyên harness, khi SaaS vận hành bằng workflow cố định và cơ sở dữ liệu được quản lý đang dần được thay thế bởi AI có trí tuệ
AI rất mạnh mẽ nhưng vẫn như ngựa hoang chưa được thuần hóa, và để khai thác sức mạnh đó cần có sự kiểm soát có hệ thống (domestication)
Harness cho AI agent được định nghĩa bởi 7 thành phần cốt lõi bao quanh LLM ở trung tâm, và mỗi thành phần quyết định độ tin cậy cũng như hiệu năng ở mức production
Trong thời đại mọi công ty đều có thể tiếp cận cùng một mô hình, bên chiến thắng không phải là bản thân mô hình mà là người thiết kế và vận hành harness tốt hơn (best rider)
Hàng nghìn thị trường tách biệt mà các big lab không ưu tiên vẫn là cơ hội còn lại cho startup

Ý nghĩa của kỷ nguyên harness

AI đang thay thế các SaaS dựa trên workflow cố định và cơ sở dữ liệu được quản lý bằng trí tuệ (intelligence), qua đó tái định nghĩa mô hình phần mềm
AI được ví như một con mustang, mạnh mẽ nhưng thô ráp nên không thể dùng nguyên trạng, và quá trình thuần hóa đó chính là harness
Bản chất của việc thuần hóa là một kiến trúc đặt LLM ở trung tâm và bố trí 7 thành phần xung quanh theo dạng tỏa tròn

7 thành phần của harness cho AI agent

1. Context & Memory (ngữ cảnh và bộ nhớ)
- Mô hình đa dụng cần truy xuất tùy biến theo từng mục đích sử dụng (bespoke retrieval); hệ thống truy xuất ngữ cảnh cho bác sĩ chẩn đoán hình ảnh không thể giống với hệ thống dành cho trợ lý pháp lý
- Bộ nhớ ngắn hạn ("agent đã làm gì cách đây 45 giây"), truy xuất ảnh quy mô lớn (chẩn đoán hình ảnh/tạo ảnh), tìm kiếm từ khóa trên hàng tỷ tài liệu... hệ thống sẽ khác nhau tùy từng trường hợp
- Bên cạnh lớp truy xuất là cơ sở dữ liệu ngữ cảnh, đóng vai trò như một "sách công thức" ghi lại cách doanh nghiệp thực sự vận hành
  - Các quy trình vận hành chuẩn (SOP) mà mọi người mang trong đầu khi đi làm chính là những công thức đó
  - Việc ghi nhận ban đầu và sự tiến hóa theo thay đổi của con người và quy trình là bản chất của cơ sở dữ liệu ngữ cảnh
2. Tools & Action (công cụ và hành động)
- Công cụ là phương tiện để agent tác động lên thế giới bên ngoài; nếu công thức trong cơ sở dữ liệu ngữ cảnh cho biết "cần làm gì", thì công cụ là nguyên liệu và dụng cụ để thực sự thực hiện điều đó
- Harness hiện đại phơi bày công cụ qua một registry, xác thực các tham số do mô hình truyền vào, điều phối lời gọi, cho các tác vụ nhạy cảm đi qua cổng phê duyệt, rồi phân tích kết quả đưa lại vào vòng lặp của agent
- MCP đang nổi lên như lớp kết nối (connective tissue) cho việc liên kết công cụ
- Chất lượng của harness được quyết định bởi số lượng công cụ có thể phơi bày một cách an toàn và khả năng xử lý lỗi gọn gàng
3. Orchestration & Loop (điều phối và vòng lặp)
- Vòng lặp của agent có cấu trúc think → act → observe → repeat
- Việc lập kế hoạch, phân rã tác vụ, sub-agent, cơ chế retry và điều kiện dừng sẽ quy định cách công việc được thực thi
- Hệ thống phải cải thiện dần theo quá trình sử dụng, và mô hình vòng lặp khép kín học hỏi từ mỗi lần chạy sẽ là yếu tố tạo khác biệt giữa các nhà cung cấp
4. State & Persistence (trạng thái và tính bền vững)
- Trong các doanh nghiệp lớn nơi nhiều người cùng lúc sử dụng hệ thống, khả năng phục hồi (resilient) là bắt buộc
- Nếu harness bị crash ở bước 7 của một quy trình 10 bước thì nó phải tiếp tục từ bước 8, thay vì chạy lại từ đầu
- Hệ thống tệp, checkpoint, session thread và kho lưu trữ artifact là các cơ chế giúp tránh mất việc đang làm
5. Sandbox & Compute (sandbox và tính toán)
- Mỗi agent cần một không gian làm việc độc lập (sandbox)
- Workspace Unix cô lập, lưu lượng mạng ra ngoài (egress) được kiểm soát, và credentials được lưu bên ngoài mô hình giúp bảo đảm an toàn, tính bảo mật và tốc độ ở quy mô lớn
6. Observability & Governance (khả năng quan sát và quản trị)
- "Không nhìn thấy thì không thể tin tưởng" - theo dõi mọi bước, ghi log mọi lời gọi công cụ, chạy evals như kiểm thử hồi quy, và có con người trong vòng lặp (human-in-the-loop) cho các quyết định rủi ro cao sẽ biến bản demo thành hệ thống production
- Guardrails dùng để cưỡng chế chính sách, còn Evals giúp phát hiện hồi quy trước cả khách hàng
7. Cost & Workflow Optimization (tối ưu chi phí và workflow)
- Thành phần thứ bảy là năng lực phán đoán về mặt kiến trúc (architectural judgment)
- Cần phân định phần nào nên xử lý theo kiểu quyết định (deterministic) hay không quyết định (non-deterministic), chọn mô hình phù hợp cho từng bước (state-of-the-art, cỡ trung, cỡ nhỏ, fine-tuned), và quyết định nên đặt tri thức trong skill hay trong bộ nhớ

Cục diện cạnh tranh mới

Kết quả là một động lực cạnh tranh mới của phần mềm, nhưng không áp dụng giống nhau cho mọi danh mục
Những thị trường mà các major lab (viện nghiên cứu AI lớn) ưu tiên sẽ hưởng lợi từ khả năng thực thi nhanh và quyền kiểm soát trực tiếp mô hình
Nhưng ngoài ra vẫn còn hàng nghìn thị trường riêng biệt mở ra cho startup
Trong thời đại mọi công ty đều có thể sử dụng cùng một mô hình, "những người cưỡi giỏi nhất (best riders)" sẽ chiến thắng - tức năng lực thiết kế và vận hành harness mới là lợi thế cạnh tranh cốt lõi

9 bình luận

junghan0611 29 ngày trước

pi rất nhẹ nên tôi hay dùng nó như công cụ agent. Ngoài ra tôi cũng tạo pi-shell-acp để nối thêm Claude Code và Gemini, và đang dùng rất ổn. Tôi tạo rồi dùng khá nhiều skill, càng thử càng thấy tùy biến theo ý mình là tốt nhất. Khi dùng ngay Claude Code, Codex v.v. thì tôi bật chế độ YOLO và tắt toàn bộ công cụ tích hợp sẵn xuống mức như của pi. Tính năng mới thì cứ như đóng búa là tắt ngay.

runai 2026-06-01

Tôi đã gỡ bỏ toàn bộ các thiết lập harness mà mình từng dùng.
Harness càng về sau, khi mô hình càng phát triển, lại càng trở thành yếu tố hạn chế hiệu năng của mô hình.
Những thiết lập harness nửa vời thậm chí còn tạo ra kết quả tệ hơn.
Các thiết lập harness vốn có trên 4.7 trở xuống nay đã აღარ còn nhiều ý nghĩa ở 4.8
và đến GPT 5.5 thì chỉ càng thêm vướng víu.

hanje3765 24 ngày trước

Các thành phần harness được nhắc đến trong bài không phải là những vấn đề có thể giải quyết đơn thuần chỉ bằng việc trí tuệ của LLM tăng lên.

Nếu bạn đang nói đến harness ở thời kỳ mà định nghĩa của nó còn chưa rõ ràng thì tôi nghĩ như vậy cũng có thể đúng, nhưng nếu là harness theo nội dung trong bài thì có vẻ đây là một lĩnh vực vẫn sẽ cần được quản lý liên tục về sau.

runai 23 ngày trước

Vấn đề không hẳn là trí thông minh; ngoài trí thông minh, các mô hình cũng đang đồng thời nâng cao năng lực sử dụng như orchestration hay công cụ. Ngay lúc này, lĩnh vực orchestration vốn là một trong những phần cốt lõi của Harness, nhưng giờ ngay cả phần đó cũng đã được hỗ trợ. Vậy thì, ở thời điểm hiện tại, nếu nói có orchestration hàng tự làm và orchestration chính hãng, thì nên dùng loại nào mới đúng?

kaydash 29 ngày trước

Tôi đồng ý. Chúng ta phải cùng nhau phát triển để thích ứng.

emptybynature 2026-06-01

Trên trang chủ OpenAI có một bài viết chính thức công bố về harnessing. Nội dung chia sẻ kinh nghiệm thực tế và các mẹo về cách OpenAI đã sử dụng harnessing trong nội bộ. Nghĩa là ngay cả OpenAI cũng dùng harnessing cho các dự án nội bộ của họ. Harnessing rõ ràng là cần thiết và ảnh hưởng trực tiếp đến chất lượng triển khai cuối cùng. Trên hết, nó còn có thể giảm tới một nửa số token cần dùng để tạo ra cùng một mức chất lượng kết quả. Vừa tối ưu được hiệu năng lẫn chi phí thì không có lý do gì để không dùng cả.

runai 2026-06-01

Trong Opus 4.8, ultracode effort đã được bổ sung, và tính năng này giải quyết tốt hơn những gì chế độ harness thủ công trước đây của lập trình viên từng làm. Vì vậy, tôi nghĩ ở thời điểm hiện tại, sẽ tốt hơn nếu bạn xóa phần orchestration khỏi chế độ harness mà bạn đang sử dụng.

gulbi135 29 ngày trước

Tôi đồng ý. Tôi cũng thấy phần orchestration thủ công cho 4.7 hay việc ép lập kế hoạch dài dòng lại thành cản trở trong 4.8 nên đã bỏ đi.
Tuy vậy, với một codebase hàng trăm nghìn dòng được bảo trì suốt nhiều năm, giá trị thực sự của harness không nằm ở orchestration mà ở lớp mà ultracode không thể thay thế được (knowledge graph, quy ước miền, các bất biến kiểm chứng), nên tôi giữ lại lớp ngữ cảnh đó và chỉ song song hóa bằng workflow những phần thực sự độc lập.
Ngược lại, nếu là dự án mới thì tôi nghĩ ultracode phù hợp hơn mà không nhất thiết cần harness. Cuối cùng, có vẻ đây không phải là vấn đề "xóa đi hay giữ lại" mà là chuyện khác nhau tùy theo tuổi đời của codebase và mức độ kết dính.

runai 29 ngày trước

Vâng. Đúng là như vậy. Phần loại bỏ orchestration vẫn còn giá trị.

Phần mềm sau AI: Khởi đầu của kỷ nguyên harness

Ý nghĩa của kỷ nguyên harness

7 thành phần của harness cho AI agent

1. Context & Memory (ngữ cảnh và bộ nhớ)

2. Tools & Action (công cụ và hành động)

3. Orchestration & Loop (điều phối và vòng lặp)

4. State & Persistence (trạng thái và tính bền vững)

5. Sandbox & Compute (sandbox và tính toán)

6. Observability & Governance (khả năng quan sát và quản trị)

7. Cost & Workflow Optimization (tối ưu chi phí và workflow)

Cục diện cạnh tranh mới

Bài viết liên quan

9 bình luận