7 điểm bởi davespark 2025-12-02 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Phân tích chuyên sâu theo hướng đảo ngược cấu trúc nội bộ của Claude Skills (tính năng AI agent của Anthropic). Skills là một cách tiếp cận thực dụng nhằm tự động hóa các tác vụ phức tạp nhưng vẫn giữ quyền kiểm soát cho người dùng, thay đổi hành vi của Claude AI thông qua tiêm prompt chứ không phải thực thi mã.

Nội dung chính:

1. Khái niệm cốt lõi: Skills là các mẫu prompt
  • Skills không dùng mã thực thi như Python/JS mà tiêm các chỉ dẫn chuyên biệt theo miền (ví dụ: hướng dẫn xử lý PDF) vào ngữ cảnh hội thoại.
  • Khác với các công cụ thông thường (Read, Write, Bash, v.v.), chúng không được chạy ngay lập tức mà giúp Claude ở trạng thái “sẵn sàng”. Ví dụ: khi gọi PDF skill, một prompt chi tiết dài 500~5.000 từ sẽ được gửi dưới dạng thông điệp ẩn.
2. Kiến trúc meta-tool
  • Meta-tool 'Skill' quản lý toàn bộ các skill riêng lẻ (PDF, skill-creator, v.v.) và khớp ý định người dùng chỉ bằng suy luận của LLM. (không dùng embedding/classifier)
  • Khi thực thi sẽ tiêm hai thông điệp: trạng thái XML ngắn gọn hiển thị trên UI ("Đang tải PDF skill") và bản hướng dẫn đầy đủ ẩn đi.
3. Cấu trúc SKILL.md và tài nguyên
  • Front matter (YAML): name, description (tín hiệu để Claude lựa chọn), allowed-tools (công cụ được tự động phê duyệt, có cân nhắc bảo mật), chỉ định model.
  • Nội dung Markdown: quy trình làm việc, thứ tự sử dụng công cụ, chỉ dẫn định dạng đầu ra (trong phạm vi 5.000 từ).
  • Thư mục hỗ trợ: scripts/ (script tự động hóa), references/ (tài liệu tham chiếu), assets/ (mẫu/ảnh, giúp tiết kiệm token).
4. Điều chỉnh ngữ cảnh thực thi và các mẫu thực chiến
  • Khi gọi skill có thể tự động thay đổi quyền công cụ (phê duyệt tạm thời) và chuyển đổi model (triển khai bằng hàm contextModifier).
  • Các mẫu thực tế:
    • Tự động hóa bằng script: chạy script cho các tác vụ nhiều bước.
    • Đọc - xử lý - ghi: chuyển đổi/làm sạch dữ liệu.
    • Tìm kiếm - phân tích - báo cáo: phân tích codebase (dùng Grep).
    • Quy trình kiểu wizard: xác nhận người dùng theo từng bước.
5. Giới hạn và ý nghĩa
  • Nhược điểm: không hỗ trợ đồng thời, overhead token (1.500+), phụ thuộc vào prompt.
  • Ưu điểm: nhấn mạnh tính linh hoạt và an toàn. Đề xuất mô hình cộng tác “con người quyết định việc quan trọng, AI xử lý phần lặp lại”. Là một hướng đi cho tương lai của AI agent, trong đó triển khai dựa trên prompt là cốt lõi.

(Nguồn bài gốc: leehanchung.github.io, đăng ngày 2025.10.26)

Chưa có bình luận nào.

Chưa có bình luận nào.