7 điểm bởi GN⁺ 6 ngày trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • OpenAI đã cập nhật mạnh mẽ Agents SDK, cung cấp hạ tầng được chuẩn hóa để agent có thể kiểm tra tệp, thực thi lệnh, chỉnh sửa mã và xử lý tác vụ dài hạn trong môi trường sandbox được kiểm soát
  • Harness mới tích hợp bộ nhớ có thể cấu hình, điều phối nhận biết sandbox, các công cụ hệ thống tệp kiểu Codex, cùng các primitive cốt lõi của hệ thống agent frontier như MCP, skills, AGENTS.md, shell, apply patch
  • Với hỗ trợ thực thi sandbox gốc, hệ thống mặc định hỗ trợ nhiều nhà cung cấp sandbox như Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel hoặc có thể kết nối sandbox riêng
  • Kiến trúc tách biệt giữa harness và compute giúp tăng cường phòng vệ trước prompt injection, thực thi bền vững dựa trên snapshot và song song hóa đa container để đảm bảo bảo mật và khả năng mở rộng
  • Tính năng này được phát hành rộng rãi (GA) cho mọi khách hàng với mô hình tính phí tiêu chuẩn theo token và mức sử dụng công cụ qua API; hỗ trợ TypeScript cùng code mode và subagents sẽ được bổ sung sau

Giới hạn của các hệ thống agent hiện nay

  • Để xây dựng agent hữu ích, nhà phát triển không chỉ cần mô hình tốt nhất mà còn cần một hệ thống hỗ trợ kiểm tra tệp, thực thi lệnh, viết mã và duy trì các tác vụ nhiều bước
  • Những đánh đổi của các cách tiếp cận hiện có
    • Framework không phụ thuộc mô hình linh hoạt nhưng không thể tận dụng trọn vẹn khả năng của các mô hình frontier
    • SDK của nhà cung cấp mô hình gần với mô hình hơn nhưng thường thiếu khả năng quan sát vào harness
    • API agent được quản lý giúp đơn giản hóa triển khai nhưng lại hạn chế nơi agent chạy và cách nó truy cập dữ liệu nhạy cảm

Harness mạnh hơn cho vòng lặp agent

  • Với lần phát hành này, harness của Agents SDK mang đến năng lực mạnh hơn cho các agent làm việc với tài liệu, tệp và hệ thống
  • Các primitive chính mới được tích hợp
    • Sử dụng công cụ thông qua MCP
    • Progressive disclosure thông qua skills
    • Chỉ dẫn tùy biến thông qua AGENTS.md
    • Thực thi mã thông qua công cụ shell
    • Chỉnh sửa tệp thông qua công cụ apply patch
  • Vì harness sẽ tiếp tục tích hợp các pattern và primitive agentic mới theo thời gian, nhà phát triển có thể tập trung vào logic theo miền thay vì cập nhật hạ tầng cốt lõi
  • Harness căn chỉnh việc thực thi theo cách các mô hình frontier đạt hiệu năng tối ưu, từ đó cải thiện độ ổn định và hiệu năng, đặc biệt trong các tác vụ chạy dài hoặc các tác vụ phức tạp cần phối hợp giữa nhiều công cụ và hệ thống
  • Hệ thống được thiết kế để hỗ trợ các yêu cầu riêng của từng sản phẩm, cho phép điều chỉnh linh hoạt việc dùng công cụ, bộ nhớ và môi trường sandbox sao cho phù hợp với stack hiện có của nhà phát triển

Thực thi sandbox gốc

  • Agents SDK được cập nhật nay hỗ trợ thực thi sandbox một cách native, cho phép agent chạy trong môi trường máy tính được kiểm soát với các tệp, công cụ và phụ thuộc cần thiết cho công việc
  • Nhiều agent hữu ích cần một workspace có thể đọc/ghi tệp, cài đặt phụ thuộc, chạy mã và sử dụng công cụ an toàn; hỗ trợ sandbox native cung cấp sẵn điều này mà không cần cấu hình riêng
  • Có thể mang theo sandbox riêng hoặc tận dụng hỗ trợ tích hợp sẵn cho Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop, Vercel
  • Để giúp môi trường có thể di chuyển giữa nhiều nhà cung cấp, OpenAI giới thiệu lớp trừu tượng Manifest
    • Có thể mount tệp cục bộ và xác định thư mục đầu ra
    • Hỗ trợ nhập dữ liệu từ các nhà cung cấp lưu trữ như AWS S3, Google Cloud Storage, Azure Blob Storage, Cloudflare R2
  • Cung cấp cho nhà phát triển một cách cấu hình môi trường nhất quán từ prototype cục bộ đến triển khai production
  • Cung cấp cho mô hình một workspace có thể dự đoán được về vị trí đầu vào, đầu ra và cách tổ chức công việc trong các tác vụ chạy dài

Tách biệt harness và compute để tăng bảo mật, độ bền và khả năng mở rộng

  • Hệ thống agent cần được thiết kế với giả định luôn tồn tại prompt injection và các nỗ lực rò rỉ dữ liệu; việc tách biệt harness và compute giúp cô lập thông tin xác thực khỏi môi trường nơi mã do mô hình tạo ra được thực thi
  • Hỗ trợ durable execution
    • Khi trạng thái agent được đưa ra ngoài, việc mất container sandbox sẽ không đồng nghĩa với mất tiến trình thực thi
    • Nhờ snapshotting và rehydration tích hợp sẵn, nếu môi trường ban đầu gặp lỗi hoặc hết hạn, hệ thống có thể khôi phục trạng thái từ checkpoint gần nhất trên container mới và tiếp tục chạy
  • Tăng cường khả năng mở rộng
    • Việc thực thi agent có thể sử dụng một hoặc nhiều sandbox
    • Chỉ gọi sandbox khi cần và có thể định tuyến subagent tới môi trường cô lập
    • Song song hóa đa container giúp tăng tốc thực thi

Trường hợp khách hàng Oscar Health

  • Theo Rachael Burns, Staff Engineer & AI Tech Lead tại Oscar Health, Agents SDK được cập nhật đã giúp hiện thực hóa ở mức production việc tự động hóa quy trình hồ sơ lâm sàng, điều mà các cách tiếp cận trước đây không thể xử lý đủ ổn định
  • Điểm khác biệt cốt lõi không chỉ là trích xuất metadata đơn giản mà là hiểu chính xác từng encounter boundary trong các hồ sơ dài và phức tạp
  • Nhờ đó, hệ thống có thể nắm bắt nhanh hơn bối cảnh khám chữa bệnh của từng bệnh nhân, góp phần cải thiện chăm sóc và trải nghiệm bệnh nhân

Giá và cách cung cấp

  • Các tính năng mới của Agents SDK được phát hành rộng rãi (GA) cho mọi khách hàng thông qua API
  • Áp dụng chính sách giá API tiêu chuẩn (tính phí theo token và mức sử dụng công cụ)

Kế hoạch sắp tới

  • OpenAI sẽ tiếp tục phát triển Agents SDK để hỗ trợ đưa các agent mạnh hơn vào production với ít hạ tầng tùy chỉnh hơn, đồng thời vẫn giữ sự linh hoạt và quyền kiểm soát cho nhà phát triển
  • Harness mới và các tính năng sandbox sẽ ra mắt trước trên Python, còn hỗ trợ TypeScript sẽ có trong các bản phát hành sau
  • OpenAI cũng đang bổ sung code modesubagents cho cả Python lẫn TypeScript
  • Trong tương lai, hệ sinh thái agent sẽ được mở rộng với nhiều nhà cung cấp sandbox, tích hợp và cách kết nối với các công cụ, hệ thống mà nhà phát triển đang dùng hơn nữa

Chưa có bình luận nào.

Chưa có bình luận nào.