Gemini Enterprise Agent Platform — nền tảng tích hợp tác nhân AI thế hệ mới của Google Cloud
(cloud.google.com)Google Cloud đã chính thức ra mắt nền tảng mới 'Gemini Enterprise Agent Platform', được mở rộng và phát triển từ Vertex AI hiện có. Nền tảng này được thiết kế để xử lý toàn bộ quy trình tạo, mở rộng, kiểm soát và tối ưu hóa các tác nhân AI (phần mềm AI có thể tự đánh giá và hành động mà không cần con người can thiệp) trong một môi trường duy nhất. Trong thời gian tới, mọi dịch vụ và lộ trình của Vertex AI hiện tại sẽ chỉ được cung cấp thông qua Agent Platform này.
Thành phần cốt lõi của nền tảng — Build, Scale, Govern, Optimize
- Agent Studio và ADK(Agent Development Kit): Cung cấp hai con đường để xây dựng tác nhân tùy theo trình độ của nhà phát triển, từ giao diện trực quan low-code (cách phát triển với ít mã) đến môi trường phát triển thiên về code. Có thể bắt đầu trong Agent Studio bằng prompt, rồi khi cần logic phức tạp hơn thì xuất sang ADK để tiếp tục phát triển.
- Agent Runtime: Hỗ trợ cold start dưới một giây và được thiết kế lại để xử lý các workflow dài hạn, nơi tác nhân có thể duy trì trạng thái trong nhiều ngày và vận hành tự động. Phù hợp với các tác vụ phức hợp kéo dài nhiều ngày như quản lý lead bán hàng.
- Memory Bank: Tự động tạo và quản lý trí nhớ dài hạn từ hội thoại, cho phép tác nhân ghi nhớ ngữ cảnh và sở thích trước đây của người dùng. Điều này mở ra các tương tác cá nhân hóa vượt ra ngoài dữ liệu phiên dùng một lần trước đây.
- Agent Identity, Registry, Gateway: Mỗi tác nhân được cấp một ID mã hóa riêng; chỉ các công cụ và tác nhân đã được phê duyệt mới được quản lý trong registry trung tâm; còn Gateway sẽ áp dụng tập trung các chính sách bảo mật và cơ chế phòng thủ trước prompt injection. Có thể xem đây như một 'tháp điều khiển' cho tác nhân.
- Agent Simulation, Evaluation, Observability: Cho phép thử nghiệm mô phỏng với người dùng tổng hợp trước khi triển khai, đánh giá tự động nhiều lượt trên lưu lượng thực tế và trực quan hóa luồng suy luận theo thời gian thực. Agent Optimizer sẽ tự động phân cụm các mẫu thất bại để đề xuất system instruction được cải thiện.
Linh hoạt trong lựa chọn mô hình
- Có thể truy cập hơn 200 mô hình thông qua Model Garden, hỗ trợ không chỉ các mô hình của Google (Gemini 3.1 Pro, Gemini 3.1 Flash Image, Lyria 3, Gemma 4) mà cả các mô hình bên thứ ba như dòng Claude của Anthropic. Đây là cấu trúc cho phép chọn mô hình tối ưu theo từng tác vụ.
Tăng cường về bảo mật và quản trị
- Agent Sandbox: Thực thi mã do tác nhân tạo ra trong môi trường bảo mật tách biệt khỏi hệ thống host, qua đó chặn các rủi ro có thể phát sinh trong những tác vụ như tự động hóa trình duyệt.
- Agent Anomaly Detection và Threat Detection: Kết hợp mô hình thống kê với đánh giá dựa trên LLM để phát hiện theo thời gian thực các suy luận bất thường hoặc hoạt động độc hại của tác nhân (kết nối reverse shell, truy cập các IP nguy hiểm đã biết, v.v.).
- Bảng điều khiển Agent Security: Cung cấp bảng điều khiển bảo mật tích hợp để ánh xạ mối quan hệ giữa tác nhân và mô hình, đồng thời tự động quét lỗ hổng ở cấp hệ điều hành và gói ngôn ngữ.
Điểm khác biệt
- Nền tảng đơn nhất cho toàn bộ vòng đời: Khác với các bộ công cụ hiện có, nền tảng này được thiết kế để quản lý toàn bộ vòng đời của tác nhân trên cùng một nền tảng, từ phát triển đến vận hành, quản trị và tối ưu hóa. Đặc biệt, việc hỗ trợ cả mô hình điều phối tác nhân với tác nhân (agent-to-agent orchestration) theo kiểu xác định lẫn kiểu sinh tạo có ý nghĩa trong các workflow doanh nghiệp phức tạp.
- Chuyển đổi tự nhiên cho khách hàng Vertex AI hiện hữu: Vì kế thừa nguyên vẹn các khả năng xây dựng mô hình và xây dựng tác nhân của Vertex AI, đồng thời bổ sung thêm các lớp tích hợp, vận hành và bảo mật, nên với người dùng hiện tại, đây mang tính mở rộng nhiều hơn là thay đổi đột ngột.
Các trường hợp triển khai thực tế
- Comcast: Cho biết đã tái cấu trúc Xfinity Assistant bằng ADK, chuyển từ tự động hóa dựa trên script sang trí tuệ sinh tạo dạng hội thoại, qua đó nâng tỷ lệ giải quyết vấn đề của khách hàng ngay từ lần liên hệ đầu tiên.
- Payhawk: Cho biết đã dùng Memory Bank để tác nhân trợ lý tài chính ghi nhớ thói quen xử lý chi phí của người dùng và tự động nộp, nhờ đó rút ngắn hơn 50% thời gian nộp báo cáo chi phí.
- L'Oréal: Giải thích rằng hãng đã kết hợp ADK với MCP(Model Context Protocol) để xây dựng nền tảng tác nhân beauty tech nội bộ, và đang chuyển từ tự động hóa workflow xác định sang điều phối tác nhân tự chủ, định hướng theo kết quả.
Chiến lược nền tảng của Google cho kỷ nguyên tác nhân đang dần thành hình
Gemini Enterprise Agent Platform là sản phẩm cho thấy Google Cloud đang chuyển trọng tâm của AI từ việc đơn thuần cung cấp mô hình sang 'hạ tầng vận hành tác nhân'. Thiết kế cấp ID cho tác nhân, phát hiện hành vi bất thường và đảm bảo vận hành dài hạn trong nhiều ngày đang trực diện xử lý những vấn đề thực tế mà doanh nghiệp gặp phải khi đưa tác nhân AI vào công việc thật. Định hướng hấp thụ toàn diện Vertex AI cũng là tín hiệu cho thấy Google đang đặt trọng lượng chiến lược đáng kể vào nền tảng này. Tuy vậy, khi hơn 200 tính năng hội tụ vào một nền tảng duy nhất, việc quản lý độ phức tạp trong vận hành thực tế và đường cong học tập sẽ được giải quyết ra sao vẫn là điều cần tiếp tục theo dõi.
Chưa có bình luận nào.