35 điểm bởi GN⁺ 2026-02-04 | 6 bình luận | Chia sẻ qua WhatsApp
  • Kỹ năng tác tử là một định dạng mở để bổ sung chức năng và tri thức chuyên môn mới cho các tác tử AI
  • Được Anthropic phát triển rồi công bố thành tiêu chuẩn mở, hiện đang được nhiều sản phẩm tác tử áp dụng
  • Mỗi skill có dạng một thư mục gồm hướng dẫn, script và tài nguyên, để tác tử khám phá và thực hiện công việc chính xác, hiệu quả hơn
  • Hỗ trợ chuyên môn theo lĩnh vực, mở rộng chức năng mới, quy trình làm việc lặp lại được, và khả năng tương tác
  • Doanh nghiệp và nhà phát triển có thể nhờ đó hiện thực hóa tái sử dụng tri thức tổ chức và tự động hóa triển khai

Tổng quan

  • Agent Skills là một định dạng đơn giản và mở để trao cho tác tử năng lực và chuyên môn mới
  • Mỗi skill là một thư mục chứa lệnh, script và tài nguyên, để tác tử tải vào và nâng cao độ chính xác cũng như hiệu quả khi làm việc

Vì sao là Agent Skills

  • Tác tử ngày càng mạnh hơn, nhưng vẫn tồn tại vấn đề thiếu thông tin ngữ cảnh để thực hiện công việc thực tế một cách ổn định
  • Skill cho phép tải tri thức thủ tục cùng ngữ cảnh theo tổ chức, nhóm và người dùng khi cần
  • Tác tử sở hữu skill có thể mở rộng năng lực tùy theo tác vụ
  • Người tạo skill có thể triển khai một chức năng đã xây dựng một lần lên nhiều sản phẩm tác tử khác nhau
  • Các tác tử tương thích cho phép người dùng bổ sung tính năng mới ngay lập tức
  • Nhóm và doanh nghiệp có thể lưu giữ tri thức tổ chức dưới dạng gói di động có thể quản lý phiên bản

Những gì có thể làm với Agent Skills

  • Chuyên môn theo lĩnh vực: đóng gói tri thức chuyên biệt như rà soát pháp lý, phân tích dữ liệu thành các hướng dẫn có thể tái sử dụng
  • Chức năng mới: bổ sung nhiều khả năng như tạo bài thuyết trình, xây dựng máy chủ MCP, phân tích tập dữ liệu
  • Quy trình làm việc lặp lại được: chuyển các tác vụ nhiều bước thành quy trình nhất quán và có thể kiểm toán
  • Khả năng tương tác: có thể tái sử dụng cùng một skill trên nhiều sản phẩm tác tử tương thích

Tình hình áp dụng

  • Agent Skills được hỗ trợ trong nhiều công cụ phát triển AI
  • Ví dụ gồm có Factory.ai, Gemini CLI, Mux, Ampcode, Letta, Autohand.ai, Spring AI, Goose, Piebald.ai, OpenAI Codex, Cursor, Databricks, Mistral Vibe, Roocode, VS Code, Agentman.ai, Trae.ai, Commandcode.ai, Firebender, Opencode.ai, Claude.ai, v.v.

Phát triển mở

  • Định dạng Agent Skills ban đầu do Anthropic phát triển và công bố như một tiêu chuẩn mở
  • Sau đó, nhiều sản phẩm tác tử khác nhau đã áp dụng, đồng thời cho phép đóng góp từ toàn bộ hệ sinh thái
  • Có thể xem định dạng và các skill mẫu thông qua kho lưu trữ GitHub

Bắt đầu

6 bình luận

 
cgl00 2026-02-04

Đã có repo chính thức của Anthropic rồi, vậy tại sao bên thứ ba vẫn làm những dự án như thế này?

 
skageektp 2026-02-04

> Agent Skills là một định dạng mở do Anthropic duy trì và mở cho cộng đồng đóng góp.

Vậy là Anthropic đã tạo ra tiêu chuẩn này nhỉ

 
cgl00 2026-02-04

Ở đây cũng là bản chính thức nhỉ.. Có vẻ là khác với cái này phải không? https://github.com/anthropics/skills

 
skageektp 2026-02-04

Vâng, cái bạn gửi là một implementation
Còn cái được chia sẻ trong bài là Spec

Giống như
tiêu chuẩn của một thứ như Docker = OCI
Docker, podman = container runtime triển khai OCI

(có thể mình nhầm)

 
cgl00 2026-02-04

À, vậy là đặc tả với phần triển khai phải không.. cảm ơn bạn

 
GN⁺ 2026-02-04
Ý kiến trên Hacker News
  • Cuộc thảo luận này bắt đầu từ nghi vấn về sự cần thiết của tiêu chuẩn hóa
    Tôi vẫn nghĩ cốt lõi của tài liệu tốt là “được viết để con người dễ đọc”. Có nhất thiết phải ép buộc một định dạng mới không? Nếu việc tăng năng suất là có thật thì hẳn có thể chứng minh bằng các nghiên cứu so sánh

    • Ngoài những gì người khác đã nói, tôi cho rằng tiêu chuẩn hóa còn mở ra cơ hội để tận dụng cho huấn luyện và RL
    • Thực tế đã có thí nghiệm so sánh. Một nhân viên Hugging Face nói rằng khi fine-tune mô hình Qwen3-0.6B với codex + skills thì điểm humaneval tăng thêm +6. Link liên quan ở đây, còn dự án là huggingface/upskill
    • Hệ thống này không chỉ là tài liệu đơn thuần, mà còn tạo chỉ mục của toàn bộ skills và gửi cho LLM ở mỗi cuộc hội thoại. Nhờ vậy LLM chỉ đọc skill khi cần. Khái niệm này khá giống khả năng khám phá tính năng trong GUI. Cá nhân tôi thấy cấu trúc xoay quanh README trực quan hơn
    • Tôi dùng Claude Code để tự động hóa công việc và nối từng tác vụ thành các lệnh slash. Rốt cuộc skills cũng chỉ là một dạng tài liệu hóa khác mà thôi. Về dài hạn, tôi nghĩ mô hình skills sẽ biến mất khi context window mở rộng và trí thông minh của mô hình tăng lên
    • Tuy vậy, xét với các mô hình hiện tại thì Claude chỉ đọc đến phần mô tả skill rồi dừng lại, nên hiệu quả tiết kiệm token là rất lớn. Với các repository lớn, sự khác biệt này đủ rõ để cảm nhận. Kiểu mẫu này đáng để phổ biến rộng hơn
  • Nhóm chúng tôi đã thành công khi coi skills như các hàm bán quyết định có thể tái sử dụng
    Ví dụ, skill /create-new-endpoint bao gồm toàn bộ phần boilerplate như cập nhật OpenAPI, thêm bài test tích hợp, v.v. Trong CLI, chỉ cần nhập số ticket JIRA là LLM có thể hoàn thành công việc với chất lượng nhất quán

    • Có người hỏi rằng “làm sao kiểm thử tính nhất quán theo thời gian?”
  • Có đề xuất tiêu chuẩn hóa cấu trúc thư mục

    .claude/skills
    .codex/skills
    .opencode/skills
    .github/skills
    
    • Dù chưa phải tiêu chuẩn, đa số công cụ CLI vẫn quét các file .md để thực thi. Nhưng sẽ tốt hơn nếu có một chuẩn thống nhất bao gồm cả plugin
    • Thực tế Codex đã bắt đầu, và OpenCode theo ngay sau đó. Tweet liên quan
    • Cuộc thảo luận này cũng đang diễn ra tại agentskills/agentskills#15
    • Có người nói rằng “mọi thứ vẫn còn quá sớm, tiêu chuẩn hóa lúc này có thể hạn chế sự sáng tạo”
    • Một người khác lập luận rằng nên theo XDG base spec và dùng đường dẫn như ~/.config/claude sẽ tốt hơn. Cách hiện tại là ~/.claude khá bất tiện
  • Có mẹo là tạo README.md trong từng thư mục con để liên kết các skill liên quan. Điều này cũng hữu ích với con người. Bài viết liên quan là Claude Skills Considered Harmful

    • Có ý kiến cho rằng “skills rốt cuộc cũng chỉ là README cho một chủ đề cụ thể”. Những nội dung phải lặp đi lặp lại nhiều lần thì chỉ cần gom lại thành skill. Cũng không nhất thiết phải theo thư mục chuẩn, lúc cần thì tự thêm trực tiếp vào context là được
    • Một người khác nói rằng dùng trình chạy lệnh như just sẽ hữu ích cho cả con người lẫn tác tử
  • Tôi thấy việc coi skills là workflow tường minh rất hiệu quả
    Nếu định nghĩa nó như một quy trình hoàn chỉnh kiểu “làm X, làm Y, rồi xác minh Z”, thì tác tử sẽ nhận diện đó như một chế độ làm việc thống nhất. Ngược lại, các hướng dẫn mơ hồ thường dễ bị bỏ qua

    • Có người nói họ đã áp dụng hệ thống hook vào Claude để tự động kích hoạt skill trong những tình huống nhất định. Ví dụ, khi xử lý file Python thì tự động gọi skill liên quan
    • Một người khác chỉ ra rằng ranh giới giữa skill và command khá mơ hồ. Nếu cuối cùng cả hai đều được dùng như lệnh, thì có thực sự cần phân biệt không?
    • Có người nhận xét cấu trúc này giống ghi chú Obsidian hoặc tập hợp lệnh CLI
    • Một người khác nhấn mạnh rằng phải mô tả điều kiện kích hoạt của skill thật rõ ràng. Trong Claude Code có thể gọi tường minh như /foo, nên họ thích cách đó hơn
  • Có người cho rằng thông qua skills có thể tài liệu hóa tri thức miền ngầm định. Những quy tắc vốn chỉ nằm trong đầu lập trình viên có thể được ghi lại, rồi tái sử dụng cho việc huấn luyện LLM

  • Có câu hỏi rằng “nếu tác tử không tự yêu cầu thì nó sẽ không dùng skills sao?”

    • Nhiều người khác cũng gặp đúng vấn đề này. Các mô hình hiện tại chưa được huấn luyện RLVR dựa trên skills nên khá dễ bối rối. Người ta kỳ vọng thế hệ mô hình tiếp theo, ví dụ Opus, sẽ dùng skills ổn định hơn nhiều
    • Trong đánh giá của Vercel, skill không được gọi trong 56% trường hợp. Thay vào đó, họ báo cáo rằng cách tiếp cận AGENTS.md hiệu quả hơn trên phạm vi rộng hơn. Blog liên quan
    • Một người dùng Codex nói rằng nếu khai báo thư mục skill trong AGENTS.md thì nó hoạt động khá tốt. Tuy nhiên, càng có nhiều skills thì khả năng xung đột càng tăng, nên tốt nhất là giữ mọi thứ đơn giản
    • Một người khác nói gần như không dùng được skills, và thay vào đó chèn trực tiếp nội dung skill vào AGENTS.md thì chính xác hơn
  • Trên skills.sh, skill phổ biến thứ ba hóa ra chỉ là một liên kết tải lệnh đơn giản. Những file SKILLS.md/AGENTS.md/COMMANDS.md này rốt cuộc cũng chỉ là tập hợp prompt, và nếu dùng sai thì có thể nguy hiểm

    • Tuy vậy, có người đáp lại rằng “với công cụ thì rốt cuộc điều quan trọng vẫn là sử dụng có trách nhiệm
  • Một người đang phát triển ngôn ngữ lập trình mới cho biết họ dùng AGENTS.md và SKILLS để giúp LLM hiểu một ngôn ngữ mà nó chưa được huấn luyện. Nhờ tiêu chuẩn hóa nên việc tích hợp công cụ dễ dàng hơn

  • Giá trị thật sự không nằm ở định dạng mà ở công bố dần dần (progressive disclosure)
    Nếu nhồi tất cả chỉ dẫn vào một tài liệu thì sẽ lãng phí token không cần thiết. Mô thức skills cho phép chỉ gọi chi tiết vào đúng thời điểm cần. Tiêu chuẩn hóa chủ yếu phục vụ phân phối và tái sử dụng

    • Đáp lại điều này, nhà phát triển của dự án MOOLLM giải thích rằng họ đã mở rộng nó thành khái niệm “Semantic Image Pyramid”.
      Họ áp dụng mức độ chi tiết tăng dần theo thứ tự GLANCE.yml → CARD.yml → SKILL.md → README.md.
      GLANCE dài 5~70 dòng để chỉ quyết định “có liên quan không?”, CARD định nghĩa giao diện, SKILL là quy trình thực tế, còn README là phần giải thích cho con người.
      Họ nói INDEX.md có tỷ lệ nén cao hơn INDEX.yml hơn 80% và cung cấp cấu trúc tự sự.
      Link liên quan: INDEX.yml, INDEX.md
      Ngoài ra, thông qua cấu trúc sniffable-python, chỉ cần đọc 50 dòng đầu của mã là có thể nắm được API.
      Tài liệu liên quan: giải thích Semantic Image Pyramid, sister-script, sniffable-python README, sniffable-python SKILL