- Kỹ năng tác tử là một định dạng mở để bổ sung chức năng và tri thức chuyên môn mới cho các tác tử AI
- Được Anthropic phát triển rồi công bố thành tiêu chuẩn mở, hiện đang được nhiều sản phẩm tác tử áp dụng
- Mỗi skill có dạng một thư mục gồm hướng dẫn, script và tài nguyên, để tác tử khám phá và thực hiện công việc chính xác, hiệu quả hơn
- Hỗ trợ chuyên môn theo lĩnh vực, mở rộng chức năng mới, quy trình làm việc lặp lại được, và khả năng tương tác
- Doanh nghiệp và nhà phát triển có thể nhờ đó hiện thực hóa tái sử dụng tri thức tổ chức và tự động hóa triển khai
Tổng quan
- Agent Skills là một định dạng đơn giản và mở để trao cho tác tử năng lực và chuyên môn mới
- Mỗi skill là một thư mục chứa lệnh, script và tài nguyên, để tác tử tải vào và nâng cao độ chính xác cũng như hiệu quả khi làm việc
Vì sao là Agent Skills
- Tác tử ngày càng mạnh hơn, nhưng vẫn tồn tại vấn đề thiếu thông tin ngữ cảnh để thực hiện công việc thực tế một cách ổn định
- Skill cho phép tải tri thức thủ tục cùng ngữ cảnh theo tổ chức, nhóm và người dùng khi cần
- Tác tử sở hữu skill có thể mở rộng năng lực tùy theo tác vụ
- Người tạo skill có thể triển khai một chức năng đã xây dựng một lần lên nhiều sản phẩm tác tử khác nhau
- Các tác tử tương thích cho phép người dùng bổ sung tính năng mới ngay lập tức
- Nhóm và doanh nghiệp có thể lưu giữ tri thức tổ chức dưới dạng gói di động có thể quản lý phiên bản
Những gì có thể làm với Agent Skills
- Chuyên môn theo lĩnh vực: đóng gói tri thức chuyên biệt như rà soát pháp lý, phân tích dữ liệu thành các hướng dẫn có thể tái sử dụng
- Chức năng mới: bổ sung nhiều khả năng như tạo bài thuyết trình, xây dựng máy chủ MCP, phân tích tập dữ liệu
- Quy trình làm việc lặp lại được: chuyển các tác vụ nhiều bước thành quy trình nhất quán và có thể kiểm toán
- Khả năng tương tác: có thể tái sử dụng cùng một skill trên nhiều sản phẩm tác tử tương thích
Tình hình áp dụng
- Agent Skills được hỗ trợ trong nhiều công cụ phát triển AI
- Ví dụ gồm có Factory.ai, Gemini CLI, Mux, Ampcode, Letta, Autohand.ai, Spring AI, Goose, Piebald.ai, OpenAI Codex, Cursor, Databricks, Mistral Vibe, Roocode, VS Code, Agentman.ai, Trae.ai, Commandcode.ai, Firebender, Opencode.ai, Claude.ai, v.v.
Phát triển mở
- Định dạng Agent Skills ban đầu do Anthropic phát triển và công bố như một tiêu chuẩn mở
- Sau đó, nhiều sản phẩm tác tử khác nhau đã áp dụng, đồng thời cho phép đóng góp từ toàn bộ hệ sinh thái
- Có thể xem định dạng và các skill mẫu thông qua kho lưu trữ GitHub
Bắt đầu
6 bình luận
Đã có repo chính thức của Anthropic rồi, vậy tại sao bên thứ ba vẫn làm những dự án như thế này?
> Agent Skills là một định dạng mở do Anthropic duy trì và mở cho cộng đồng đóng góp.
Vậy là Anthropic đã tạo ra tiêu chuẩn này nhỉ
Ở đây cũng là bản chính thức nhỉ.. Có vẻ là khác với cái này phải không? https://github.com/anthropics/skills
Vâng, cái bạn gửi là một implementation
Còn cái được chia sẻ trong bài là Spec
Giống như
tiêu chuẩn của một thứ như Docker = OCI
Docker, podman = container runtime triển khai OCI
(có thể mình nhầm)
À, vậy là đặc tả với phần triển khai phải không.. cảm ơn bạn
Ý kiến trên Hacker News
Cuộc thảo luận này bắt đầu từ nghi vấn về sự cần thiết của tiêu chuẩn hóa
Tôi vẫn nghĩ cốt lõi của tài liệu tốt là “được viết để con người dễ đọc”. Có nhất thiết phải ép buộc một định dạng mới không? Nếu việc tăng năng suất là có thật thì hẳn có thể chứng minh bằng các nghiên cứu so sánh
Nhóm chúng tôi đã thành công khi coi skills như các hàm bán quyết định có thể tái sử dụng
Ví dụ, skill
/create-new-endpointbao gồm toàn bộ phần boilerplate như cập nhật OpenAPI, thêm bài test tích hợp, v.v. Trong CLI, chỉ cần nhập số ticket JIRA là LLM có thể hoàn thành công việc với chất lượng nhất quánCó đề xuất tiêu chuẩn hóa cấu trúc thư mục
.mdđể thực thi. Nhưng sẽ tốt hơn nếu có một chuẩn thống nhất bao gồm cả plugin~/.config/claudesẽ tốt hơn. Cách hiện tại là~/.claudekhá bất tiệnCó mẹo là tạo README.md trong từng thư mục con để liên kết các skill liên quan. Điều này cũng hữu ích với con người. Bài viết liên quan là Claude Skills Considered Harmful
justsẽ hữu ích cho cả con người lẫn tác tửTôi thấy việc coi skills là workflow tường minh rất hiệu quả
Nếu định nghĩa nó như một quy trình hoàn chỉnh kiểu “làm X, làm Y, rồi xác minh Z”, thì tác tử sẽ nhận diện đó như một chế độ làm việc thống nhất. Ngược lại, các hướng dẫn mơ hồ thường dễ bị bỏ qua
/foo, nên họ thích cách đó hơnCó người cho rằng thông qua skills có thể tài liệu hóa tri thức miền ngầm định. Những quy tắc vốn chỉ nằm trong đầu lập trình viên có thể được ghi lại, rồi tái sử dụng cho việc huấn luyện LLM
Có câu hỏi rằng “nếu tác tử không tự yêu cầu thì nó sẽ không dùng skills sao?”
Trên skills.sh, skill phổ biến thứ ba hóa ra chỉ là một liên kết tải lệnh đơn giản. Những file SKILLS.md/AGENTS.md/COMMANDS.md này rốt cuộc cũng chỉ là tập hợp prompt, và nếu dùng sai thì có thể nguy hiểm
Một người đang phát triển ngôn ngữ lập trình mới cho biết họ dùng AGENTS.md và SKILLS để giúp LLM hiểu một ngôn ngữ mà nó chưa được huấn luyện. Nhờ tiêu chuẩn hóa nên việc tích hợp công cụ dễ dàng hơn
Giá trị thật sự không nằm ở định dạng mà ở công bố dần dần (progressive disclosure)
Nếu nhồi tất cả chỉ dẫn vào một tài liệu thì sẽ lãng phí token không cần thiết. Mô thức skills cho phép chỉ gọi chi tiết vào đúng thời điểm cần. Tiêu chuẩn hóa chủ yếu phục vụ phân phối và tái sử dụng
Họ áp dụng mức độ chi tiết tăng dần theo thứ tự GLANCE.yml → CARD.yml → SKILL.md → README.md.
GLANCE dài 5~70 dòng để chỉ quyết định “có liên quan không?”, CARD định nghĩa giao diện, SKILL là quy trình thực tế, còn README là phần giải thích cho con người.
Họ nói INDEX.md có tỷ lệ nén cao hơn INDEX.yml hơn 80% và cung cấp cấu trúc tự sự.
Link liên quan: INDEX.yml, INDEX.md
Ngoài ra, thông qua cấu trúc sniffable-python, chỉ cần đọc 50 dòng đầu của mã là có thể nắm được API.
Tài liệu liên quan: giải thích Semantic Image Pyramid, sister-script, sniffable-python README, sniffable-python SKILL