Claude Skills thật ấn tượng, có thể còn là một đổi mới lớn hơn cả MCP

(simonwillison.net)

52 điểm bởi GN⁺ 2025-10-18 | 12 bình luận | Chia sẻ qua WhatsApp

Claude Skills do Anthropic công bố là một mẫu mới, trong đó các chỉ dẫn, script và tài nguyên cần thiết để mô hình thực hiện một tác vụ cụ thể được cung cấp dưới dạng thư mục, theo cách tải động chuyên môn theo từng tác vụ
Skills gồm các tệp Markdown và script tùy chọn; khi bắt đầu phiên, chỉ siêu dữ liệu của mỗi skill được tải với vài chục token, sau đó chỉ khi thực sự cần mới nạp toàn bộ nội dung nên hiệu quả token rất cao
Thông qua Claude Code, Skills mở rộng vượt ra ngoài một công cụ lập trình đơn thuần để trở thành tác nhân tự động hóa đa dụng; chỉ cần có hệ thống tệp và môi trường thực thi lệnh là có thể tự động hóa nhiều loại công việc khác nhau
Khác với MCP, Skills không phải là một giao thức mà là cấu trúc đơn giản dựa trên Markdown và YAML, nên có thể dùng ngay với các mô hình hay công cụ khác và rất dễ chia sẻ, lan rộng
Nhờ sự đơn giản và hiệu quả này, hệ sinh thái Skills được kỳ vọng sẽ mở rộng nhanh hơn nhiều so với MCP, đồng thời cho phép xây dựng các tác nhân chuyên biệt trong nhiều lĩnh vực từ báo chí dữ liệu tới hướng dẫn thương hiệu (tránh được vấn đề tiêu tốn token và đặc tả phức tạp của MCP)

Khái niệm và cấu trúc của Skills

Anthropic đã chính thức công bố Claude Skills vào ngày 16/10/2025
- Đây là hệ thống mở rộng năng lực theo đơn vị thư mục chứa các chỉ dẫn, script và tài nguyên cần thiết khi mô hình thực hiện một tác vụ cụ thể (ví dụ: làm việc với Excel, tuân thủ hướng dẫn thương hiệu của tổ chức)
- Claude chỉ truy cập skill tương ứng khi nó có liên quan đến tác vụ, từ đó cải thiện khả năng thực hiện những công việc chuyên biệt
Kho GitHub anthropic/skills cung cấp các ví dụ skill chính thức
Về mặt khái niệm, Skills cực kỳ đơn giản
- Cốt lõi là một tệp Markdown cho mô hình biết cách thực hiện công việc
- Có thể tùy chọn thêm tài liệu bổ sung và script viết sẵn để hỗ trợ hoàn thành tác vụ
Tính năng tạo tài liệu của Claude được công bố vào tháng 9 thực chất đã được triển khai hoàn toàn bằng Skills
- Có thể xem các skill xử lý tệp .pdf, .docx, .xlsx, .pptx trong kho công khai

Hiệu quả token: ưu điểm cốt lõi của Skills

Khi bắt đầu phiên, Claude quét tất cả các tệp skill khả dụng và chỉ đọc mô tả ngắn trong frontmatter YAML của từng skill
Lượng token ban đầu mà mỗi skill chiếm chỉ vài chục token, nên cực kỳ hiệu quả
Chỉ khi người dùng yêu cầu một tác vụ mà skill có thể hỗ trợ thì toàn bộ chi tiết mới được nạp
Đây là điểm khác biệt cốt lõi biến nó thành một tính năng, chứ không chỉ đơn giản là lưu tệp trên đĩa

Thực hành với skill tạo GIF cho Slack

Mô tả siêu dữ liệu của skill slack-gif-creator
- Bộ công cụ tạo GIF động tối ưu cho Slack
- Bao gồm trình kiểm tra ràng buộc kích thước và các thành phần hoạt ảnh cơ bản có thể kết hợp
- Áp dụng cho các yêu cầu như “hãy tạo cho tôi một GIF dùng cho Slack về cảnh X làm Y”
Quy trình thử nghiệm thực tế
- Kích hoạt skill slack-gif-creator trên mô hình Sonnet 4.5 trong ứng dụng web di động của Claude
- Nhập prompt “Make me a gif for slack about how Skills are way cooler than MCPs”
- Claude tự động tạo GIF (chất lượng vẫn cần cải thiện, nhưng việc lặp lại để cải tiến skill lại rất dễ)
Những điểm đáng chú ý trong script Python được tạo ra
- Thêm thư mục skill vào đường dẫn Python: sys.path.insert(0, '/mnt/skills/examples/slack-gif-creator')
- Tận dụng lớp GIFBuilder trong thư mục core/ của skill
- Lưu tệp vào /mnt/user-data/outputs/
- Dùng hàm kiểm tra giới hạn kích thước của Slack (2MB) check_slack_size() để xác nhận tuân thủ quy cách
- Nếu kích thước vượt quá giới hạn, mô hình có thể tự động thử tạo lại một tệp nhỏ hơn

Sự phụ thuộc vào môi trường của Skills

Cơ chế Skills chỉ có thể hoạt động đầy đủ khi mô hình có thể truy cập
- Hệ thống tệp
- Công cụ duyệt hệ thống tệp
- Khả năng thực thi lệnh trong môi trường
Đây là một mẫu phổ biến trong hệ công cụ LLM
- ChatGPT Code Interpreter là ví dụ quy mô lớn đầu tiên từ đầu năm 2023
- Sau đó mở rộng tới máy cục bộ thông qua các công cụ tác nhân lập trình như Cursor, Claude Code, Codex CLI, Gemini CLI
Yêu cầu này là khác biệt lớn nhất so với các nỗ lực mở rộng năng lực LLM trước đó như MCP, ChatGPT Plugins
Đây là một phụ thuộc quan trọng, nhưng quy mô năng lực mới được mở khóa thì lớn đến mức đáng kinh ngạc
Vấn đề an toàn vẫn rất quan trọng
- Cần cung cấp môi trường lập trình an toàn
- Cần cách xây dựng môi trường sandbox để giới hạn thiệt hại từ các cuộc tấn công như prompt injection xuống mức chấp nhận được

Claude Code: tiến hóa thành tác nhân đa dụng

Vào tháng 1/2025, tác giả từng dự đoán rằng “agent” sẽ thất bại, nhưng đã sai hoàn toàn
- Trên thực tế, 2025 đã trở thành năm của “agent” (dù có nhiều định nghĩa khác nhau, ở đây được định nghĩa là “tools in a loop”)
Claude Code là một cái tên chưa chuẩn
- Nó không chỉ là công cụ lập trình thuần túy mà là công cụ tự động hóa máy tính đa dụng
- Có thể tự động hóa mọi tác vụ mà người ta có thể hoàn thành bằng cách nhập lệnh vào máy tính
- Mô tả nó là tác nhân đa dụng (general agent) là phù hợp nhất
Skills khiến tiềm năng này trở nên rõ ràng và tường minh hơn nhiều
Phạm vi ứng dụng rộng tới mức choáng ngợp
- Ví dụ về báo chí dữ liệu: có thể tổ chức một thư mục skill xử lý các việc sau
  - Hiểu nguồn gốc và cấu trúc dữ liệu điều tra dân số Hoa Kỳ
  - Nạp dữ liệu ở nhiều định dạng khác nhau vào SQLite/DuckDB bằng thư viện Python
  - Xuất bản dữ liệu trực tuyến dưới dạng tệp Parquet trên S3 hoặc bảng Datasette Cloud
  - Cách tìm ra những câu chuyện thú vị từ bộ dữ liệu mới (theo hướng dẫn của phóng viên dữ liệu giàu kinh nghiệm)
  - Xây dựng trực quan hóa dữ liệu gọn gàng, dễ đọc bằng D3
- Kết quả: chỉ với các tệp Markdown và vài script Python mẫu, có thể xây dựng một “tác nhân báo chí dữ liệu” để phát hiện và xuất bản câu chuyện từ dữ liệu điều tra dân số Hoa Kỳ

So sánh Skills và MCP

Model Context Protocol (MCP) đã thu hút sự quan tâm rất lớn kể từ khi ra mắt vào tháng 11/2024
- Mọi công ty đều cần một “chiến lược AI”, và việc công bố triển khai MCP là một cách dễ dàng để đáp ứng nhu cầu đó
Dần dần, những giới hạn của MCP bắt đầu lộ rõ
- Vấn đề quan trọng nhất là mức sử dụng token
- MCP chính thức của GitHub tự nó đã tiêu tốn hàng chục nghìn token ngữ cảnh
- Chỉ cần thêm vài cái nữa là gần như không còn chỗ cho LLM làm việc hữu ích thực sự
Kể từ khi bắt đầu nghiêm túc với các tác nhân lập trình, tác giả cũng ít quan tâm đến MCP hơn
- Gần như mọi thứ có thể đạt được bằng MCP đều có thể thay thế bằng công cụ CLI
- LLM biết cách gọi cli-tool --help, nên không cần tốn nhiều token để giải thích cách dùng
- Mô hình có thể tự tìm hiểu khi cần
Skills có đúng những ưu điểm đó, thậm chí còn hơn thế vì không cần phải triển khai cả một công cụ CLI mới
- Chỉ cần thả vào một tệp Markdown mô tả cách thực hiện công việc
- Chỉ thêm script khi nó giúp cải thiện độ ổn định hoặc hiệu quả

Triển vọng tăng trưởng bùng nổ của hệ sinh thái Skills

Một trong những điểm thú vị nhất của Skills là rất dễ chia sẻ
- Nhiều skill được kỳ vọng sẽ chỉ là một tệp đơn
- Những skill tinh vi hơn sẽ ở dạng thư mục với vài tệp
Tài liệu do Anthropic cung cấp
- Agent Skills docs
- Claude Skills Cookbook
Tác giả cũng đang lên ý tưởng cho các skill như cách xây dựng plugin Datasette
Có thể dùng với các mô hình khác: đây là một ưu điểm lớn khác trong thiết kế của Skills
- Có thể gắn thư mục skill vào Codex CLI hoặc Gemini CLI rồi yêu cầu “hãy đọc pdf/SKILL.md và tạo cho tôi một file PDF giải thích dự án này”, và nó sẽ hoạt động
- Điều này khả thi ngay cả khi công cụ hay mô hình đó không có kiến thức tích hợp sẵn về hệ thống skill
Dự đoán: sẽ có một vụ nổ kỷ Cambri của Skills khiến làn sóng MCP năm nay trở nên mờ nhạt

Sự đơn giản là sức mạnh cốt lõi

Một số người phản ứng rằng Skills quá đơn giản nên khó gọi là một tính năng
- Nhiều người vốn đã thử nghiệm mẹo thêm chỉ dẫn vào tệp Markdown rồi cho tác nhân lập trình đọc nó
- AGENTS.md là một mẫu đã được thiết lập vững chắc, và hoàn toàn có thể chứa chỉ dẫn như “hãy đọc PDF.md trước khi tạo PDF”
Chính sự đơn giản cốt lõi trong thiết kế của Skills là lý do khiến tác giả hào hứng
MCP là cả một đặc tả giao thức hoàn chỉnh
- Host, client, server, resource, prompt, tool, sampling, root, elicitation
- Bao gồm ba phương thức truyền tải (stdio, streamable HTTP, ban đầu là SSE)
Skills chỉ là Markdown + một ít siêu dữ liệu YAML + script thực thi tùy chọn
- Nó gần với tinh thần của LLM hơn nhiều: đưa văn bản vào và để mô hình tự xử lý
Skills chuyển phần khó sang LLM harness và môi trường máy tính liên quan
- Đây là một chiến lược rất khôn ngoan nếu xét đến mọi điều đã học được trong vài năm qua về năng lực thực thi công cụ của LLM

12 bình luận

shakespeares 2025-10-19

Có lẽ đây cũng là phần có thể được áp dụng khi dùng Claude Code cho việc lập trình. Hiện tại tôi cũng đang đưa hướng dẫn vào Claude.md và tách riêng các hướng dẫn chi tiết để triển khai.

labeldock 2025-10-19

Có vẻ như để thực hiện nhiều tác vụ với ít token, thay vì tối ưu hóa prompt thì có thể giải quyết khá đơn giản bằng cách tận dụng multi-agent và tóm tắt. Tôi đồng ý với vấn đề được nêu ra, nhưng cảm thấy cách giải quyết này cũng có những giới hạn nhất định.

savvykang 2025-10-18

Skills cũng dùng token phải không? Nếu vậy thì có vẻ vấn đề về mức sử dụng token sẽ lại phát sinh, nhưng đến lúc đó thì tôi không rõ sẽ ứng phó thế nào.

dnjstmxhs 2025-10-19

Có vẻ là không phải toàn bộ SKILLS.md đều được đưa vào context, mà lúc đầu luôn chỉ có phần tên và mô tả như bên dưới được đưa vào trước.

name: skill-creator
description: Hướng dẫn để tạo các skill hiệu quả. Skill này nên được dùng khi người dùng muốn tạo một skill mới (hoặc cập nhật skill hiện có) nhằm mở rộng khả năng của Claude bằng kiến thức chuyên biệt, quy trình làm việc hoặc tích hợp công cụ.
license: Complete terms in LICENSE.txt

ds2ilz 2025-10-18

Khi làm việc với Claude Code, tôi cứ phải liên tục nhét các chỉ dẫn hay quy định vào context, rồi cuối cùng lại phải cân nhắc giữa lượng token sử dụng và context. Sau đó tôi nghĩ ra cách tạo thư mục, viết chi tiết vào đó bằng các file md theo từng chức năng, còn trong claude.md thì chỉ nhét thật nhiều pointer kiểu muốn làm gì thì xem cái nào; cách này hoạt động khá tốt mà chi phí cũng rẻ. Skills về bản chất chắc là tập hợp những thứ như vậy, nên có vẻ sẽ khá hữu ích.

laeyoung 2025-10-19

Và đúng như đã công bố, nếu sau này còn có cả skills marketplace nữa thì chỉ cần tải về những skill cần thiết, rồi bật lên khi cần dùng, như vậy có vẻ cũng khá ổn.

shakespeares 2025-10-19

Ồ, cảm ơn vì phần giải thích cốt lõi.

2025-10-18

[Bình luận này đã bị ẩn.]