OpenAI âm thầm giới thiệu ‘Skills’, có thể dùng trong ChatGPT và Codex CLI

(simonwillison.net)

4 điểm bởi GN⁺ 2025-12-13 | 1 bình luận | Chia sẻ qua WhatsApp

Skill là một thư mục gồm các tệp Markdown và tài nguyên tùy chọn, tạo thành cấu trúc cho phép LLM duyệt hệ thống tệp để thực hiện chức năng
Trong môi trường Code Interpreter của ChatGPT, thư mục /home/oai/skills đã được thêm vào, bao gồm các skill để xử lý bảng tính, DOCX và PDF
Skill PDF chuyển tài liệu thành PNG theo từng trang rồi phân tích bằng mô hình thị giác, nhờ đó giữ lại thông tin bố cục và đồ họa
Trong Codex CLI, tính năng skill dựa trên thư mục ~/.codex/skills cũng đã được bổ sung ở dạng thử nghiệm, cho phép người dùng tự viết và sử dụng skill
Cấu trúc skill gọn nhẹ này giúp tăng khả năng tương tác giữa các công cụ AI, đồng thời đặt ra nhu cầu chuẩn hóa trong tương lai

Tính năng skill trong ChatGPT

Trong môi trường Code Interpreter của ChatGPT, thư mục /home/oai/skills đã được phát hiện
- Elias Judin là người đầu tiên xác nhận điều này, và nếu nhập prompt Create a zip file of /home/oai/skills thì có thể nén nội dung thư mục để tải về
- Simon Willison đã tự thử, công khai tệp ZIP và cung cấp một web UI để duyệt nội dung đó
Các skill đi kèm xử lý những chức năng liên quan đến bảng tính, DOCX và PDF
- Skill PDF và tài liệu hoạt động bằng cách render tệp thành PNG theo từng trang rồi chuyển cho mô hình thị giác, từ đó giữ được thông tin bố cục vốn có thể bị mất khi chỉ trích xuất văn bản đơn thuần
Elias Judin đã chia sẻ bản sao các skill trên GitHub, và cấu trúc này tương tự kho anthropics/skills của Anthropic
Khi yêu cầu ChatGPT “tạo PDF tóm tắt tình hình cây rimu và mùa sinh sản của kakapo”, mô hình GPT-5.2 đã tham chiếu skill.md để đọc hướng dẫn tạo PDF, sau đó tìm kiếm thông tin liên quan và tạo tài liệu PDF
- Quá trình mất khoảng 11 phút, và khi phông chữ không hỗ trợ ký tự macron thì hệ thống tự động thay bằng phông khác, cho thấy quy trình làm việc có tự kiểm chứng

Hỗ trợ skill trong Codex CLI

Một PR bổ sung hỗ trợ skills.md đã được hợp nhất vào công cụ mã nguồn mở Codex CLI của OpenAI
- Theo tài liệu, mỗi thư mục trong ~/.codex/skills sẽ được nhận diện là một skill
- Phần mã liên quan được triển khai tại codex-rs/core/src/skills/render.rs
Simon Willison đã dùng khả năng viết skill của Claude Opus 4.5 để tạo một skill phục vụ việc tạo plugin Datasette, rồi cài nó vào Codex CLI
- Có thể bật tính năng skill bằng lệnh codex --enable skills -m gpt-5.2, và dùng lệnh list skills để kiểm tra danh sách skill đã cài đặt
- Codex nhận diện skill “viết plugin Datasette” và theo yêu cầu đã tự động sinh mã plugin để thêm trang / - /cowsay?text=hello
- Mã được tạo đã được công khai trên GitHub và có thể chạy trực tiếp bằng lệnh uvx

Ý nghĩa của khái niệm skill

Sau khi Claude Skills được giới thiệu vào tháng 10/2025, OpenAI đã tích hợp nó vào ChatGPT và Codex chỉ sau hai tháng
Skill có đặc tả rất đơn giản, nhưng vẫn hoạt động như đơn vị thực thi có thể chia sẻ giữa nhiều công cụ AI khác nhau
Tác giả cho rằng cấu trúc này cần được tài liệu hóa chính thức thông qua các tổ chức như Agentic AI Foundation
Việc OpenAI áp dụng được xem là một ví dụ làm tăng khả năng chuẩn hóa cho tính tương tác giữa các AI dựa trên skill

1 bình luận

GN⁺ 2025-12-13

Ý kiến trên Hacker News

Thật đáng ngạc nhiên khi Anthropic liên tục đưa ra những đổi mới đơn giản nhưng trực quan
MCP gần như còn khó gọi là một giao thức, nhưng Skills thì dù chỉ là một file md đơn giản, họ vẫn thể hiện khả năng định hình vấn đề rất xuất sắc
- Nhìn vào thông báo quyên tặng MCP của Anthropic và việc thành lập Agentic AI Foundation, thấy khá thú vị khi họ “đóng gói” một giao thức được tạo ra từ 1 năm trước thành một “quỹ”. Có chút năng lượng công ty công nghệ kiểu Gavin Belson
- Anthropic giống như những người có thể giao cảm với LLM. Giống như Nagel từng cố hiểu giác quan của loài dơi, họ trông như đội ngũ hiểu rõ nhất giác quan của các mô hình AI frontier
- Nhưng MCP quá đơn giản nên cũng có thể trở thành một thảm họa bảo mật
- Ngay cả tên công ty là ‘Anthropic’, nên có cảm giác việc nhân hóa AI chính là bản sắc của họ. MCP, Skills và những thứ tương tự dường như đều xuất phát từ một triết lý nhất quán theo hướng đó
- Ngay cả trên ứng dụng Android cũng cảm nhận được UX thanh lịch của Claude. Ví dụ như khi chỉnh sửa đoạn văn, chỉ đến lúc đó nút gửi dưới dạng tin nhắn mới hiện ra, tạo thành một luồng rất tinh tế
Tính đến hôm nay, họ đã gửi cảnh báo công khai tới người đăng ký OpenAI Plus
Quảng bá context 196k token nhưng thực tế bị cắt khi nhập quá 50k token
Vấn đề tương tự từng xảy ra với GPT-5.0 trước đây, và lần này lại tái diễn
Xem liên kết trợ giúp chính thức
- Và bản Xhigh là chỉ dành cho API, nên không thể dùng trong ChatGPT
Khi viết bài này, tôi rất vui vì cũng có thể đề cập luôn tin về mùa sinh sản của Kākāpō
(Không phải chỉ nói về bồ nông)
- Vì thế Kākāpō Benchmark đã ra đời
- Hôm nay là lần đầu tôi biết đến một con vẹt xanh to lớn không biết bay
- Có người đùa không biết rồi sẽ có ngày Kākāpō đi xe đạp không
- Skills là một ý tưởng hay, nhưng vì đặc tả quá nhẹ nên tôi nghĩ cần được tài liệu hóa chính thức
  Tuy vậy, vì cũng có khả năng bị dùng sai nên ở góc độ doanh nghiệp họ có thể sẽ thận trọng
  Cũng tò mò không biết đã ai thử nó với LLM chạy cục bộ chưa
Khái niệm “Skill” vẫn chưa thật sự rõ ràng
Có vẻ nó chỉ là một công cụ quản lý ngữ cảnh. Có đúng là sau khi đọc mô tả, nếu mô hình thấy cần thì nó sẽ tải các script hay tài liệu liên quan vào không, người này hỏi vậy
- Về cơ bản Skill có cấu trúc thư mục + file markdown. Có thể xem ví dụ ở Datasette plugin skill. Khi khởi động, Claude Code quét tất cả các thư mục skill và chỉ đưa phần mô tả vào context, rồi khi cần mới tải toàn bộ nội dung
- Claude Code đôi khi không “nhớ” được skill của chính nó. Vì vậy tôi thường phải gọi thủ công.
  Ví dụ: “Dùng skill Image Manipulation để tạo icon từ image.png”
  Tôi cũng để Claude tự viết skill cho chính nó. Mẫu skill của tôi được công khai trên GitHub
- Skill cũng có thể thay thế MCP server. Ví dụ thay vì một MCP server để lấy kết quả build CI, có thể triển khai cùng chức năng đó bằng một script đơn giản và SKILL.md.
  Cấu trúc này mang cảm giác giống triết lý UNIX, với các công cụ nhỏ được nối với nhau thành pipeline
- Theo cách tôi hiểu thì SKILL.md là tài liệu cốt lõi cho Claude biết khi nào cần làm gì.
  Tôi thường chỉ thị rõ ràng kiểu “hãy load wireframe-skill và thực hiện X”.
  Tôi cảm thấy việc tải tất cả reference cùng lúc chính xác hơn so với progressive loading
- Skill rất hữu ích để tự động hóa các tác vụ lặp lại như debug, commit, xử lý PR.
  Đặc biệt, skill debug giúp AI không bị mắc kẹt trong vòng lặp
Xét về mặt kỹ thuật, skill là một hệ thống tiêm prompt tự động
Nó là phiên bản đơn giản hóa của những gì đa số ứng dụng AI wrapper đang làm (tiêm prompt + RAG + MCP)
- Thực tế thì giờ đây nhiều ứng dụng AI wrapper có thể được thay thế chỉ bằng một thư mục và một file markdown
Gửi lời cảm ơn đến @simonw vì lúc nào cũng thêm alt text cho hình ảnh
Có ai hỏi liệu giữa Skill và Tool có khác biệt mang tính nền tảng không. Liệu có thể tạo một skill ngắn để dùng như tool hay không
Nếu muốn dùng skill trên các mô hình khác nữa (như Gemini CLI), có thể dùng open-skills mà tôi làm
Tuy nhiên, cần Mac, chạy trong container cục bộ nên không phụ thuộc vào đám mây
Video công bố triết lý thiết kế Skills của Anthropic đã được phát hành
Xem liên kết YouTube
Cấu trúc ngày càng phức tạp nên thấy rối rắm
Trước đây còn mở rộng context bằng agents.md, giờ lại phải thêm một file md khác nữa
- Tôi chỉ thị cho Claude kiểu “hãy tự đánh giá phần nào của công việc này đáng để biến thành skill, rồi dùng skill-making skill để tạo nó”
- MCP thì phức tạp, nhưng Skills lại cho cảm giác là thiết kế đơn giản nhất để thêm chức năng vào các coding agent hiện có

OpenAI âm thầm giới thiệu ‘Skills’, có thể dùng trong ChatGPT và Codex CLI

Tính năng skill trong ChatGPT

Hỗ trợ skill trong Codex CLI

Ý nghĩa của khái niệm skill

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News