- Hướng dẫn thực tiễn dành cho các nhóm sản phẩm và kỹ thuật lần đầu phát triển agent dựa trên LLM
- Khác với các hệ thống tự động hóa truyền thống, agent là hệ thống có thể tự đánh giá và hành động ngay cả trong những tình huống phức tạp và mơ hồ
- Giải thích nhiều mẫu thiết kế, từ hệ thống agent đơn đến điều phối đa agent
- Nhấn mạnh việc thiết lập guardrail và chiến lược can thiệp của con người (human intervention) để bảo đảm độ tin cậy và an toàn
- Khuyến nghị bắt đầu với phạm vi nhỏ, sau đó mở rộng dần dựa trên phản hồi của người dùng
Agent là gì
- Agent là hệ thống thực hiện công việc thay cho người dùng
- Những mô hình chỉ phản hồi một lần như chatbot đơn giản hay bộ phân tích cảm xúc không được xem là agent
- Agent có hai chức năng cốt lõi sau
- Quản lý thực thi workflow và ra quyết định: đánh giá đã hoàn tất hay chưa, sửa lỗi và trả lại quyền kiểm soát cho người dùng khi thất bại
- Sử dụng công cụ (tool): tương tác với hệ thống bên ngoài để thu thập dữ liệu hoặc thực hiện hành động
Khi nào nên xây dựng agent
- Phù hợp với những lĩnh vực mà cách tự động hóa truyền thống thất bại hoặc khó bảo trì
- Các trường hợp phù hợp
- Ra quyết định phức tạp: khi cần phán đoán tinh tế như phê duyệt hoàn tiền cho khách hàng
- Hệ thống dựa trên luật khó bảo trì: khi quy tắc phức tạp như tự động hóa quy trình rà soát bảo mật
- Xử lý dữ liệu phi cấu trúc: khi cần phân tích tài liệu, hiểu ngôn ngữ tự nhiên
Các thành phần cơ bản trong thiết kế agent
- Model: LLM phụ trách suy luận và ra quyết định
- Tools: các hàm API tương tác với hệ thống bên ngoài
- Instructions: chỉ dẫn rõ ràng định nghĩa hành vi của agent
Hướng dẫn chọn model
- Phát triển prototype bằng model có hiệu năng tốt nhất → sau đó thử thay bằng model nhỏ hơn có xét đến chi phí và độ trễ
- Thiết lập evals và xác minh độ chính xác trước khi tối ưu hóa
Cách định nghĩa tool
- Thiết kế tool theo cách chuẩn hóa để tăng khả năng tái sử dụng
- Các loại tool
- Tra cứu dữ liệu: tìm kiếm DB, đọc tài liệu, tìm kiếm web
- Thực hiện hành động: gửi email, cập nhật CRM
- Điều phối: gọi các agent khác để phân chia công việc
Best practice khi viết instructions
- Tận dụng tài liệu vận hành hiện có hoặc tài liệu chính sách để viết chỉ dẫn rõ ràng theo từng bước
- Chia nhỏ công việc và mô tả thành các đơn vị hành động cụ thể
- Bắt buộc bao gồm cách xử lý lỗi hoặc tình huống ngoại lệ (edge case)
Các mẫu orchestration
Hệ thống agent đơn
- Một agent xử lý nhiều tác vụ thông qua vòng lặp lặp lại (run loop)
- Sử dụng prompt template để ứng phó với nhiều tình huống khác nhau
- Khuyến nghị duy trì agent đơn cho đến khi mức độ phức tạp vẫn còn có thể quản lý được
Hệ thống đa agent
Mẫu manager (Manager Pattern)
- Agent manager trung tâm gọi nhiều agent chuyên biệt như tool để điều phối workflow
- Duy trì giao diện nhất quán với người dùng
Mẫu phân tán (Decentralized Pattern)
- Các agent handoff cho nhau và chuyển giao quyền kiểm soát
- Agent có chuyên môn cụ thể sẽ nắm quyền kiểm soát vào thời điểm cần thiết
- Phù hợp cho việc phân luồng tác vụ (triage) đơn giản ở giai đoạn đầu
Guardrails
Mục đích
- Bảo vệ quyền riêng tư dữ liệu và ngăn hệ thống bị lạm dụng
- Duy trì tính nhất quán của thương hiệu và chặn các phản hồi không phù hợp
Các loại chính
- Lọc mức độ liên quan: chặn đầu vào không liên quan đến chủ đề
- Lọc an toàn: phát hiện nỗ lực vượt rào hệ thống (jailbreak)
- Bộ lọc thông tin cá nhân (PII): chặn lộ lọt thông tin nhạy cảm
- Moderation: chặn nội dung bạo lực, phát ngôn thù ghét
- Quản lý rủi ro công cụ: bổ sung xác minh khi gọi công cụ có rủi ro cao
Chiến lược triển khai
- Ưu tiên cao nhất cho quyền riêng tư dữ liệu và an toàn nội dung
- Liên tục bổ sung theo các rủi ro mới được phát hiện trong quá trình sử dụng thực tế
- Cân bằng giữa bảo mật và trải nghiệm người dùng
Can thiệp của con người (Human-in-the-loop)
- Chuyển quyền kiểm soát cho con người khi agent thất bại hoặc khi xử lý tác vụ có rủi ro cao
- Các trigger điển hình
- Vượt ngưỡng thất bại
- Yêu cầu tác vụ có độ nhạy cảm cao (hoàn tiền, thanh toán, v.v.)
Kết luận
- Agent là hệ thống mang tính đột phá, có thể tự động hóa workflow trong những tình huống phức tạp và bất định
- Xây dựng vững chắc hệ model-tool-instructions và mở rộng orchestration một cách dần dần
- Cần bắt buộc thiết lập guardrails và cơ chế can thiệp của con người để bảo đảm an toàn và độ tin cậy
- Bắt đầu nhỏ, xác minh nhanh và mở rộng tính năng từng bước là chìa khóa để triển khai thành công
1 bình luận
https://notebooklm.google.com/notebook/…
Tôi đã thử làm bằng notebooklm.