25 điểm bởi GN⁺ 13 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Bộ API có thể kết hợp giúp xây dựng và triển khai các agent quy mô lớn trên môi trường cloud, cho phép đưa prototype lên production chỉ trong vài ngày
  • Tự động xử lý hạ tầng cấp production như sandbox bảo mật, quản lý thông tin xác thực, kiểm soát quyền hạn, để người dùng chỉ cần tập trung vào việc định nghĩa tác vụ
  • Hỗ trợ phiên chạy dài, cộng tác đa agent, quản trị dựa trên độ tin cậy, đồng thời tích hợp chặt chẽ với các mô hình Claude để cung cấp khả năng lặp tự động và cải thiện hiệu năng
  • Các công ty lớn như Notion, Rakuten, Asana, Sentry đang sử dụng giải pháp này để hiện thực hóa triển khai nhanh hơn 10 lần và workflow tự động hóa
  • Cung cấp theo mô hình tính phí theo mức sử dụng, là một nền tảng cải thiện căn bản hiệu quả vận hành và năng suất phát triển của tổ chức

Tổng quan về Claude Managed Agents

  • Claude Managed Agents được cung cấp dưới dạng beta công khai, là một bộ API có thể kết hợp để xây dựng và triển khai các agent quy mô lớn trên cloud
  • Trước đây, việc phát triển agent thường mất nhiều tháng do phải xử lý hạ tầng bảo mật, quản lý trạng thái, kiểm soát quyền hạn, thích ứng với nâng cấp mô hình; còn Managed Agents cho phép chuyển từ prototype sang production chỉ trong vài ngày
  • Hỗ trợ từ bộ thực thi tác vụ đơn lẻ đến các pipeline đa agent phức tạp, giúp người dùng tập trung vào trải nghiệm người dùng mà không phải gánh overhead vận hành

Xây dựng và triển khai agent nhanh hơn 10 lần

  • Để triển khai agent ở mức production cần có thực thi mã trong sandbox, checkpoint, quản lý thông tin xác thực, thiết lập phạm vi quyền hạn, theo dõi end-to-end
  • Managed Agents xử lý thay phần phức tạp này, còn người dùng chỉ cần định nghĩa tác vụ, công cụ và guardrail
  • Orchestration harness tích hợp sẵn tự động thực hiện việc xác định thời điểm gọi công cụ, quản lý ngữ cảnh và phục hồi lỗi
  • Các tính năng chính:
    • Agent cấp production: tự động xử lý sandbox bảo mật, xác thực và thực thi công cụ
    • Phiên chạy dài: hoạt động tự chủ trong nhiều giờ, vẫn giữ tiến độ và đầu ra ngay cả khi kết nối bị gián đoạn
    • Cộng tác đa agent: tạo và chỉ đạo các agent khác để song song hóa tác vụ phức tạp (đang ở giai đoạn research preview)
    • Quản trị dựa trên độ tin cậy: tích hợp sẵn phạm vi quyền hạn, quản lý ID và theo dõi thực thi

Thiết kế tích hợp với mô hình Claude

  • Các mô hình Claude được tối ưu cho các tác vụ lấy agent làm trung tâm, và Managed Agents được thiết kế để khai thác tối đa điều đó
  • Người dùng chỉ cần định nghĩa kết quả và tiêu chí thành công, Claude sẽ tự đánh giá và lặp lại để đạt mục tiêu (có trong research preview)
  • Khi cần, vẫn hỗ trợ workflow kiểu prompt-response truyền thống
  • Trong thử nghiệm nội bộ, với tác vụ tạo file có cấu trúc, hiệu năng tăng tối đa 10 điểm so với vòng lặp prompt tiêu chuẩn
  • Theo dõi phiên, phân tích tích hợp và hướng dẫn xử lý sự cố được tích hợp trong Claude Console, cho phép kiểm tra mọi lần gọi công cụ và quá trình ra quyết định

Các trường hợp sử dụng thực tế

  • Nhiều đội ngũ đã hiện thực hóa triển khai production nhanh hơn 10 lần với Managed Agents
    • Agent lập trình: phân tích codebase, lập kế hoạch chỉnh sửa, tạo PR
    • Agent năng suất: tham gia dự án, thực hiện tác vụ, cung cấp đầu ra
    • Agent tài chính/pháp lý: xử lý tài liệu và trích xuất thông tin cốt lõi
  • Các ví dụ doanh nghiệp tiêu biểu:
    • Notion

      • Vận hành phiên bản alpha của Custom Agents, cho phép giao việc trực tiếp cho Claude ngay trong workspace
      • Kỹ sư có thể triển khai mã, còn nhân sự tri thức có thể tạo website, bài thuyết trình và chạy song song hàng chục tác vụ
    • Rakuten

      • Triển khai agent toàn công ty tích hợp với Slack và Teams cho các bộ phận sản phẩm, bán hàng, marketing, tài chính và HR
      • Mỗi agent chuyên môn được triển khai trong vòng 1 tuần
    • Asana

      • Tích hợp các agent cộng tác với con người vào dự án thông qua AI Teammates
      • Xây dựng các tính năng nâng cao chỉ trong vài tuần với Managed Agents
    • Vibecode

      • Xây dựng hạ tầng ứng dụng AI-native nối liền từ prompt đến triển khai app bằng Managed Agents
      • Có thể xây dựng cùng hạ tầng đó nhanh hơn 10 lần
    • Sentry

      • Kết hợp agent gỡ lỗi Seer với agent viết bản vá dựa trên Claude
      • Tự động hóa trong một flow duy nhất từ phát hiện bug đến tạo PR, hoàn tất tích hợp trong vài tuần thay vì vài tháng

Trích dẫn từ khách hàng

  • Ansh Nanda (đồng sáng lập): trước đây phải quản lý LLM thủ công trong sandbox, còn giờ có thể xây dựng hạ tầng nhanh hơn 10 lần chỉ với vài dòng code, mở ra triển vọng bùng nổ ứng dụng AI-native
  • Indragie Karunaratne (Giám đốc Kỹ thuật AI/ML tại Sentry): Managed Agents mang lại runtime bảo mật và được quản lý hoàn toàn, cải thiện trải nghiệm nhà phát triển và loại bỏ gánh nặng vận hành
  • Sanchan Saxena (Phụ trách sản phẩm tại Atlassian): tích hợp agent vào workflow Jira, tự động hóa sandbox, phiên chạy và quản lý quyền hạn, từ đó nâng cao hiệu quả kỹ thuật
  • Javed Qadrud-Din (CTO): Managed Agents có thể tạo công cụ cần thiết ngay tại chỗ để xử lý mọi truy vấn người dùng, rút ngắn thời gian phát triển 10 lần
  • John Han (đồng sáng lập): triển khai agent chuẩn production cho chuẩn bị cuộc họp chỉ trong vài ngày, tự động kết nối hệ thống bên ngoài và tìm kiếm web
  • Eric Liu (PM tại Notion): nhờ các phiên chạy dài và quản lý bộ nhớ, có thể ủy quyền các tác vụ mở phức tạp
  • Yusuke Kaji (Phụ trách AI tại Rakuten): triển khai agent chuyên môn cho từng bộ phận trong vòng 1 tuần, đạt được mở rộng an toàn và dân chủ hóa đổi mới
  • Amritansh Raghav (CTO của Asana): tăng tốc đáng kể tốc độ phát triển AI Teammates, đồng thời củng cố trải nghiệm cộng tác cấp doanh nghiệp

Bắt đầu sử dụng

  • Managed Agents áp dụng mô hình tính phí theo mức sử dụng, cộng thêm $0.08 mỗi giờ phiên vào mức giá token tiêu chuẩn của Claude Platform
  • Có thể xem chi tiết giá trong tài liệu chính thức
  • Có thể triển khai agent đầu tiên qua Claude Console hoặc CLI, đồng thời hỗ trợ tích hợp với Claude Codeclaude-api Skill
  • Có thể bắt đầu onboarding bằng lệnh “start onboarding for managed agents in Claude API”

Đổi mới vận hành tổ chức

  • Managed Agents là công cụ có thể chuyển đổi căn bản cách tổ chức vận hành,
    giúp nhà phát triển và đội ngũ tập trung vào năng suất và trải nghiệm người dùng thay vì hạ tầng
  • Dự kiến sẽ có cập nhật liên tục và mở rộng cộng đồng thông qua Claude Platform

1 bình luận

 
Ý kiến Hacker News
  • Tôi nghi đây sẽ dẫn tới điều phối tối ưu
    Mã nguồn mở có thể sẽ không kịp đưa ra lựa chọn thay thế tốt hơn
    Cho tới nay, hiệu năng tốt nhất lại đến từ việc trộn các agent của nhiều công ty
    Quan trọng hơn ‘planner’ là ‘worker’. Có những agent vượt trội hẳn ở các tác vụ cụ thể
    Ví dụ, Opus 4.6 về phát hiện bug thì GPT 5.4 xhigh không thể so được
    Cũng như trong thế giới thực, nhiều cách tư duy khác nhau làm tăng độ vững chắc của một đội ngũ, việc phối trộn agent cũng cho hiệu ứng tương tự

    • Nếu Anthropic muốn tạo ra phiên bản tốt nhất, họ sẽ phải đánh bại mọi công ty AI khác ở tất cả các tác vụ chi tiết như tài liệu kỹ thuật, sơ đồ, phát hiện bug, v.v.
      Nhưng khó mà họ cho phép gọi các model bên ngoài như Codex bên trong stack của họ
    • Điều tôi lo là chuyện này có thể kết thúc ở một ngôn ngữ điều phối tối ưu
      Ví dụ, nếu Claude biến toàn bộ giao tiếp giữa các agent sang tiếng Sumer thì sao?
      Có khi chỉ một công ty nào đó lại độc chiếm chuyên môn về ngôn ngữ đó
    • Tôi cũng thấy trộn model của nhiều công ty là tốt nhất
      Viết spec bằng Opus → sửa bằng Gemini → quay lại Opus để lấy phản hồi → tôi tự rà lại → build bằng Qwen3.5 → review bằng Opus
      Luồng này từng rất hoàn hảo, nhưng Anthropic đổi chính sách rồi làm nó gãy mất
    • Các công ty AI hiện giờ đúng kiểu cua trong chậu
      Một công ty tung ra model đóng, các công ty khác sẽ phân tích nó, cải tiến rồi phát hành mã nguồn mở
      Cuối cùng họ cứ ghì chân nhau, rồi sau này có khi lại thành cartel
  • Có thể thấy Anthropic đang cố kéo các nhà phát triển vào nền tảng của họ
    Muốn IPO thì họ phải trở thành công ty nền tảng, chứ không thể chỉ là nhà cung cấp model
    Mọi bước đi hiện tại đều chỉ về hướng đó

  • Tôi dùng Claude Code mỗi ngày, nhưng để hệ thống của khách hàng phụ thuộc vào Anthropic thì rất rủi ro
    Kỹ thuật chất lượng không phải điểm mạnh của họ. Mức độ sẵn sàng kiểu ‘single 9’ thì không ổn chút nào

  • Đây vẫn là giai đoạn đầu của framework agent, giống thời web trước cả PHP
    Tuần nào cũng có pattern và model mới xuất hiện, khiến mọi framework phải làm lại
    LangChain đang cố trở thành kiểu Next.js/Vercel, nhưng đa số vẫn khuyên nên tự dựng
    Anthropic có lợi thế vì họ sở hữu model trực tiếp, nên sẽ có một mức nhu cầu nhất định cho giải pháp rào cản thấp, nhưng lock-in và tốc độ thay đổi công nghệ vẫn là vấn đề

    • Tôi cũng đồng ý. Hiện giờ đúng kiểu thời kỳ có hàng trăm giải pháp nửa vời trôi nổi trên blog hay GitHub
      LangChain là bên tiến gần nhất, nhưng vẫn rất đậm chất DIY
      Chưa kể ai cũng đang trộn những vector DB và model reranking khác nhau
  • Tôi cũng đang tự làm thứ tương tự, nên khá bất ngờ khi thấy cách tiếp cận của Anthropic như một ý tưởng song song
    Tuyệt đối phải tránh bị trói vào một nhà cung cấp model duy nhất
    Với đội nhỏ thì có thể ổn, nhưng trong hệ thống phức tạp thì gần như là tự sát
    Phải so sánh và kết hợp nhiều model, rồi quản lý theo phong cách riêng của mình. Giống như nấu ăn, mỗi tình huống cần chọn một hương vị khác nhau

    • Thật ra ai cũng đang làm na ná nhau. Số hướng có thể đi là có hạn
    • Tôi tò mò lý do phải tránh lock-in là chỉ vì hiệu năng, hay còn vì Anthropic có thể dùng dữ liệu telemetry để sau này trở thành đối thủ cạnh tranh
    • Tôi cũng cùng quan điểm. Dựng kiểu hệ thống này trên nền nền tảng tổng hợp như openrouter thực ra khá đơn giản
  • Trang do các agent đó tạo ra tệ quá, chữ testimonial bị chồng lên nhau nên không đọc nổi

    • Tôi thì chỉ thấy nguyên một màn hình đen
  • Tôi đang chạy một container Docker để tạo site Jekyll bằng Anthropic Agentic SDK
    Việc dựng hạ tầng không quá khó, phần thực sự khó là khiến agent hành xử đúng như mình muốn
    Sau này có thể tôi sẽ chuyển sang nhà cung cấp khác hoặc tự host, nên muốn giữ sự tự do đó

  • Tôi vẫn sẽ dùng tổ hợp pydantic aidbos/temporal/celery
    Tôi không muốn bị trói vào một nhà cung cấp cụ thể nào. Tôi muốn được tự do dùng bất kỳ LLM nào
    Cần tiếp tục thúc đẩy sự phát triển của điều phối mã nguồn mở

  • Nhìn thì hào nhoáng đấy, nhưng có thể thành quả bom chi phí
    Giống AWS, chỉ cần bất cẩn là hàng nghìn agent sẽ chạy và hóa đơn tăng vọt
    Với Anthropic thì đây có vẻ sẽ là một mô hình doanh thu cực lớn

  • Hướng đi này là bước tiếp theo có thể đoán trước
    Đây là cách dễ để tăng doanh thu và siết lock-in người dùng mà không cần làm model thông minh hơn
    Phân tích liên quan được tổng hợp khá tốt trong bài viết này