- Skill là một thư mục gồm các tệp Markdown và tài nguyên tùy chọn, tạo thành cấu trúc cho phép LLM duyệt hệ thống tệp để thực hiện chức năng
- Trong môi trường Code Interpreter của ChatGPT, thư mục
/home/oai/skills đã được thêm vào, bao gồm các skill để xử lý bảng tính, DOCX và PDF
- Skill PDF chuyển tài liệu thành PNG theo từng trang rồi phân tích bằng mô hình thị giác, nhờ đó giữ lại thông tin bố cục và đồ họa
- Trong Codex CLI, tính năng skill dựa trên thư mục
~/.codex/skills cũng đã được bổ sung ở dạng thử nghiệm, cho phép người dùng tự viết và sử dụng skill
- Cấu trúc skill gọn nhẹ này giúp tăng khả năng tương tác giữa các công cụ AI, đồng thời đặt ra nhu cầu chuẩn hóa trong tương lai
Tính năng skill trong ChatGPT
- Trong môi trường Code Interpreter của ChatGPT, thư mục
/home/oai/skills đã được phát hiện
- Elias Judin là người đầu tiên xác nhận điều này, và nếu nhập prompt
Create a zip file of /home/oai/skills thì có thể nén nội dung thư mục để tải về
- Simon Willison đã tự thử, công khai tệp ZIP và cung cấp một web UI để duyệt nội dung đó
- Các skill đi kèm xử lý những chức năng liên quan đến bảng tính, DOCX và PDF
- Skill PDF và tài liệu hoạt động bằng cách render tệp thành PNG theo từng trang rồi chuyển cho mô hình thị giác, từ đó giữ được thông tin bố cục vốn có thể bị mất khi chỉ trích xuất văn bản đơn thuần
- Elias Judin đã chia sẻ bản sao các skill trên GitHub, và cấu trúc này tương tự kho
anthropics/skills của Anthropic
- Khi yêu cầu ChatGPT “tạo PDF tóm tắt tình hình cây rimu và mùa sinh sản của kakapo”, mô hình GPT-5.2 đã tham chiếu
skill.md để đọc hướng dẫn tạo PDF, sau đó tìm kiếm thông tin liên quan và tạo tài liệu PDF
- Quá trình mất khoảng 11 phút, và khi phông chữ không hỗ trợ ký tự macron thì hệ thống tự động thay bằng phông khác, cho thấy quy trình làm việc có tự kiểm chứng
Hỗ trợ skill trong Codex CLI
- Một PR bổ sung hỗ trợ
skills.md đã được hợp nhất vào công cụ mã nguồn mở Codex CLI của OpenAI
- Theo tài liệu, mỗi thư mục trong
~/.codex/skills sẽ được nhận diện là một skill
- Phần mã liên quan được triển khai tại
codex-rs/core/src/skills/render.rs
- Simon Willison đã dùng khả năng viết skill của Claude Opus 4.5 để tạo một skill phục vụ việc tạo plugin Datasette, rồi cài nó vào Codex CLI
- Có thể bật tính năng skill bằng lệnh
codex --enable skills -m gpt-5.2, và dùng lệnh list skills để kiểm tra danh sách skill đã cài đặt
- Codex nhận diện skill “viết plugin Datasette” và theo yêu cầu đã tự động sinh mã plugin để thêm trang / - /cowsay?text=hello
- Mã được tạo đã được công khai trên GitHub và có thể chạy trực tiếp bằng lệnh
uvx
Ý nghĩa của khái niệm skill
- Sau khi Claude Skills được giới thiệu vào tháng 10/2025, OpenAI đã tích hợp nó vào ChatGPT và Codex chỉ sau hai tháng
- Skill có đặc tả rất đơn giản, nhưng vẫn hoạt động như đơn vị thực thi có thể chia sẻ giữa nhiều công cụ AI khác nhau
- Tác giả cho rằng cấu trúc này cần được tài liệu hóa chính thức thông qua các tổ chức như Agentic AI Foundation
- Việc OpenAI áp dụng được xem là một ví dụ làm tăng khả năng chuẩn hóa cho tính tương tác giữa các AI dựa trên skill
1 bình luận
Ý kiến trên Hacker News
Thật đáng ngạc nhiên khi Anthropic liên tục đưa ra những đổi mới đơn giản nhưng trực quan
MCP gần như còn khó gọi là một giao thức, nhưng Skills thì dù chỉ là một file md đơn giản, họ vẫn thể hiện khả năng định hình vấn đề rất xuất sắc
Tính đến hôm nay, họ đã gửi cảnh báo công khai tới người đăng ký OpenAI Plus
Quảng bá context 196k token nhưng thực tế bị cắt khi nhập quá 50k token
Vấn đề tương tự từng xảy ra với GPT-5.0 trước đây, và lần này lại tái diễn
Xem liên kết trợ giúp chính thức
Khi viết bài này, tôi rất vui vì cũng có thể đề cập luôn tin về mùa sinh sản của Kākāpō
(Không phải chỉ nói về bồ nông)
Tuy vậy, vì cũng có khả năng bị dùng sai nên ở góc độ doanh nghiệp họ có thể sẽ thận trọng
Cũng tò mò không biết đã ai thử nó với LLM chạy cục bộ chưa
Khái niệm “Skill” vẫn chưa thật sự rõ ràng
Có vẻ nó chỉ là một công cụ quản lý ngữ cảnh. Có đúng là sau khi đọc mô tả, nếu mô hình thấy cần thì nó sẽ tải các script hay tài liệu liên quan vào không, người này hỏi vậy
Ví dụ: “Dùng skill Image Manipulation để tạo icon từ image.png”
Tôi cũng để Claude tự viết skill cho chính nó. Mẫu skill của tôi được công khai trên GitHub
Cấu trúc này mang cảm giác giống triết lý UNIX, với các công cụ nhỏ được nối với nhau thành pipeline
Tôi thường chỉ thị rõ ràng kiểu “hãy load wireframe-skill và thực hiện X”.
Tôi cảm thấy việc tải tất cả reference cùng lúc chính xác hơn so với progressive loading
Đặc biệt, skill debug giúp AI không bị mắc kẹt trong vòng lặp
Xét về mặt kỹ thuật, skill là một hệ thống tiêm prompt tự động
Nó là phiên bản đơn giản hóa của những gì đa số ứng dụng AI wrapper đang làm (tiêm prompt + RAG + MCP)
Gửi lời cảm ơn đến @simonw vì lúc nào cũng thêm alt text cho hình ảnh
Có ai hỏi liệu giữa Skill và Tool có khác biệt mang tính nền tảng không. Liệu có thể tạo một skill ngắn để dùng như tool hay không
Nếu muốn dùng skill trên các mô hình khác nữa (như Gemini CLI), có thể dùng open-skills mà tôi làm
Tuy nhiên, cần Mac, chạy trong container cục bộ nên không phụ thuộc vào đám mây
Video công bố triết lý thiết kế Skills của Anthropic đã được phát hành
Xem liên kết YouTube
Cấu trúc ngày càng phức tạp nên thấy rối rắm
Trước đây còn mở rộng context bằng agents.md, giờ lại phải thêm một file md khác nữa