Bước tiến hóa tiếp theo của Agents SDK

(openai.com)

7 điểm bởi GN⁺ 2026-04-16 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

OpenAI đã cập nhật mạnh mẽ Agents SDK, cung cấp hạ tầng được chuẩn hóa để agent có thể kiểm tra tệp, thực thi lệnh, chỉnh sửa mã và xử lý tác vụ dài hạn trong môi trường sandbox được kiểm soát
Harness mới tích hợp bộ nhớ có thể cấu hình, điều phối nhận biết sandbox, các công cụ hệ thống tệp kiểu Codex, cùng các primitive cốt lõi của hệ thống agent frontier như MCP, skills, AGENTS.md, shell, apply patch
Với hỗ trợ thực thi sandbox gốc, hệ thống mặc định hỗ trợ nhiều nhà cung cấp sandbox như Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel hoặc có thể kết nối sandbox riêng
Kiến trúc tách biệt giữa harness và compute giúp tăng cường phòng vệ trước prompt injection, thực thi bền vững dựa trên snapshot và song song hóa đa container để đảm bảo bảo mật và khả năng mở rộng
Tính năng này được phát hành rộng rãi (GA) cho mọi khách hàng với mô hình tính phí tiêu chuẩn theo token và mức sử dụng công cụ qua API; hỗ trợ TypeScript cùng code mode và subagents sẽ được bổ sung sau

Giới hạn của các hệ thống agent hiện nay

Để xây dựng agent hữu ích, nhà phát triển không chỉ cần mô hình tốt nhất mà còn cần một hệ thống hỗ trợ kiểm tra tệp, thực thi lệnh, viết mã và duy trì các tác vụ nhiều bước
Những đánh đổi của các cách tiếp cận hiện có
- Framework không phụ thuộc mô hình linh hoạt nhưng không thể tận dụng trọn vẹn khả năng của các mô hình frontier
- SDK của nhà cung cấp mô hình gần với mô hình hơn nhưng thường thiếu khả năng quan sát vào harness
- API agent được quản lý giúp đơn giản hóa triển khai nhưng lại hạn chế nơi agent chạy và cách nó truy cập dữ liệu nhạy cảm

Harness mạnh hơn cho vòng lặp agent

Với lần phát hành này, harness của Agents SDK mang đến năng lực mạnh hơn cho các agent làm việc với tài liệu, tệp và hệ thống
Các primitive chính mới được tích hợp
- Sử dụng công cụ thông qua MCP
- Progressive disclosure thông qua skills
- Chỉ dẫn tùy biến thông qua AGENTS.md
- Thực thi mã thông qua công cụ shell
- Chỉnh sửa tệp thông qua công cụ apply patch
Quảng cáo
Vì harness sẽ tiếp tục tích hợp các pattern và primitive agentic mới theo thời gian, nhà phát triển có thể tập trung vào logic theo miền thay vì cập nhật hạ tầng cốt lõi
Harness căn chỉnh việc thực thi theo cách các mô hình frontier đạt hiệu năng tối ưu, từ đó cải thiện độ ổn định và hiệu năng, đặc biệt trong các tác vụ chạy dài hoặc các tác vụ phức tạp cần phối hợp giữa nhiều công cụ và hệ thống
Hệ thống được thiết kế để hỗ trợ các yêu cầu riêng của từng sản phẩm, cho phép điều chỉnh linh hoạt việc dùng công cụ, bộ nhớ và môi trường sandbox sao cho phù hợp với stack hiện có của nhà phát triển

Thực thi sandbox gốc

Agents SDK được cập nhật nay hỗ trợ thực thi sandbox một cách native, cho phép agent chạy trong môi trường máy tính được kiểm soát với các tệp, công cụ và phụ thuộc cần thiết cho công việc
Nhiều agent hữu ích cần một workspace có thể đọc/ghi tệp, cài đặt phụ thuộc, chạy mã và sử dụng công cụ an toàn; hỗ trợ sandbox native cung cấp sẵn điều này mà không cần cấu hình riêng
Có thể mang theo sandbox riêng hoặc tận dụng hỗ trợ tích hợp sẵn cho Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel
Để giúp môi trường có thể di chuyển giữa nhiều nhà cung cấp, OpenAI giới thiệu lớp trừu tượng Manifest
- Có thể mount tệp cục bộ và xác định thư mục đầu ra
- Hỗ trợ nhập dữ liệu từ các nhà cung cấp lưu trữ như AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2
Cung cấp cho nhà phát triển một cách cấu hình môi trường nhất quán từ prototype cục bộ đến triển khai production
Cung cấp cho mô hình một workspace có thể dự đoán được về vị trí đầu vào, đầu ra và cách tổ chức công việc trong các tác vụ chạy dài

Tách biệt harness và compute để tăng bảo mật, độ bền và khả năng mở rộng

Hệ thống agent cần được thiết kế với giả định luôn tồn tại prompt injection và các nỗ lực rò rỉ dữ liệu; việc tách biệt harness và compute giúp cô lập thông tin xác thực khỏi môi trường nơi mã do mô hình tạo ra được thực thi
Hỗ trợ durable execution
- Khi trạng thái agent được đưa ra ngoài, việc mất container sandbox sẽ không đồng nghĩa với mất tiến trình thực thi
- Nhờ snapshotting và rehydration tích hợp sẵn, nếu môi trường ban đầu gặp lỗi hoặc hết hạn, hệ thống có thể khôi phục trạng thái từ checkpoint gần nhất trên container mới và tiếp tục chạy
Tăng cường khả năng mở rộng
- Việc thực thi agent có thể sử dụng một hoặc nhiều sandbox
- Chỉ gọi sandbox khi cần và có thể định tuyến subagent tới môi trường cô lập
- Song song hóa đa container giúp tăng tốc thực thi
Quảng cáo

Trường hợp khách hàng Oscar Health

Theo Rachael Burns, Staff Engineer & AI Tech Lead tại Oscar Health, Agents SDK được cập nhật đã giúp hiện thực hóa ở mức production việc tự động hóa quy trình hồ sơ lâm sàng, điều mà các cách tiếp cận trước đây không thể xử lý đủ ổn định
Điểm khác biệt cốt lõi không chỉ là trích xuất metadata đơn giản mà là hiểu chính xác từng encounter boundary trong các hồ sơ dài và phức tạp
Nhờ đó, hệ thống có thể nắm bắt nhanh hơn bối cảnh khám chữa bệnh của từng bệnh nhân, góp phần cải thiện chăm sóc và trải nghiệm bệnh nhân

Giá và cách cung cấp

Các tính năng mới của Agents SDK được phát hành rộng rãi (GA) cho mọi khách hàng thông qua API
Áp dụng chính sách giá API tiêu chuẩn (tính phí theo token và mức sử dụng công cụ)

Kế hoạch sắp tới

OpenAI sẽ tiếp tục phát triển Agents SDK để hỗ trợ đưa các agent mạnh hơn vào production với ít hạ tầng tùy chỉnh hơn, đồng thời vẫn giữ sự linh hoạt và quyền kiểm soát cho nhà phát triển
Harness mới và các tính năng sandbox sẽ ra mắt trước trên Python, còn hỗ trợ TypeScript sẽ có trong các bản phát hành sau
OpenAI cũng đang bổ sung code mode và subagents cho cả Python lẫn TypeScript
Trong tương lai, hệ sinh thái agent sẽ được mở rộng với nhiều nhà cung cấp sandbox, tích hợp và cách kết nối với các công cụ, hệ thống mà nhà phát triển đang dùng hơn nữa

Bước tiến hóa tiếp theo của Agents SDK

Giới hạn của các hệ thống agent hiện nay

Harness mạnh hơn cho vòng lặp agent

Thực thi sandbox gốc

Tách biệt harness và compute để tăng bảo mật, độ bền và khả năng mở rộng

Trường hợp khách hàng Oscar Health

Giá và cách cung cấp

Kế hoạch sắp tới

Bài viết liên quan

Chưa có bình luận nào.