- Claude Skills do Anthropic công bố là một mẫu mới, trong đó các chỉ dẫn, script và tài nguyên cần thiết để mô hình thực hiện một tác vụ cụ thể được cung cấp dưới dạng thư mục, theo cách tải động chuyên môn theo từng tác vụ
- Skills gồm các tệp Markdown và script tùy chọn; khi bắt đầu phiên, chỉ siêu dữ liệu của mỗi skill được tải với vài chục token, sau đó chỉ khi thực sự cần mới nạp toàn bộ nội dung nên hiệu quả token rất cao
- Thông qua Claude Code, Skills mở rộng vượt ra ngoài một công cụ lập trình đơn thuần để trở thành tác nhân tự động hóa đa dụng; chỉ cần có hệ thống tệp và môi trường thực thi lệnh là có thể tự động hóa nhiều loại công việc khác nhau
- Khác với MCP, Skills không phải là một giao thức mà là cấu trúc đơn giản dựa trên Markdown và YAML, nên có thể dùng ngay với các mô hình hay công cụ khác và rất dễ chia sẻ, lan rộng
- Nhờ sự đơn giản và hiệu quả này, hệ sinh thái Skills được kỳ vọng sẽ mở rộng nhanh hơn nhiều so với MCP, đồng thời cho phép xây dựng các tác nhân chuyên biệt trong nhiều lĩnh vực từ báo chí dữ liệu tới hướng dẫn thương hiệu (tránh được vấn đề tiêu tốn token và đặc tả phức tạp của MCP)
Khái niệm và cấu trúc của Skills
- Anthropic đã chính thức công bố Claude Skills vào ngày 16/10/2025
- Đây là hệ thống mở rộng năng lực theo đơn vị thư mục chứa các chỉ dẫn, script và tài nguyên cần thiết khi mô hình thực hiện một tác vụ cụ thể (ví dụ: làm việc với Excel, tuân thủ hướng dẫn thương hiệu của tổ chức)
- Claude chỉ truy cập skill tương ứng khi nó có liên quan đến tác vụ, từ đó cải thiện khả năng thực hiện những công việc chuyên biệt
- Kho GitHub anthropic/skills cung cấp các ví dụ skill chính thức
- Về mặt khái niệm, Skills cực kỳ đơn giản
- Cốt lõi là một tệp Markdown cho mô hình biết cách thực hiện công việc
- Có thể tùy chọn thêm tài liệu bổ sung và script viết sẵn để hỗ trợ hoàn thành tác vụ
- Tính năng tạo tài liệu của Claude được công bố vào tháng 9 thực chất đã được triển khai hoàn toàn bằng Skills
- Có thể xem các skill xử lý tệp
.pdf, .docx, .xlsx, .pptx trong kho công khai
Hiệu quả token: ưu điểm cốt lõi của Skills
- Khi bắt đầu phiên, Claude quét tất cả các tệp skill khả dụng và chỉ đọc mô tả ngắn trong frontmatter YAML của từng skill
- Lượng token ban đầu mà mỗi skill chiếm chỉ vài chục token, nên cực kỳ hiệu quả
- Chỉ khi người dùng yêu cầu một tác vụ mà skill có thể hỗ trợ thì toàn bộ chi tiết mới được nạp
- Đây là điểm khác biệt cốt lõi biến nó thành một tính năng, chứ không chỉ đơn giản là lưu tệp trên đĩa
Thực hành với skill tạo GIF cho Slack
- Mô tả siêu dữ liệu của skill slack-gif-creator
- Bộ công cụ tạo GIF động tối ưu cho Slack
- Bao gồm trình kiểm tra ràng buộc kích thước và các thành phần hoạt ảnh cơ bản có thể kết hợp
- Áp dụng cho các yêu cầu như “hãy tạo cho tôi một GIF dùng cho Slack về cảnh X làm Y”
- Quy trình thử nghiệm thực tế
- Kích hoạt skill slack-gif-creator trên mô hình Sonnet 4.5 trong ứng dụng web di động của Claude
- Nhập prompt “Make me a gif for slack about how Skills are way cooler than MCPs”
- Claude tự động tạo GIF (chất lượng vẫn cần cải thiện, nhưng việc lặp lại để cải tiến skill lại rất dễ)
- Những điểm đáng chú ý trong script Python được tạo ra
- Thêm thư mục skill vào đường dẫn Python:
sys.path.insert(0, '/mnt/skills/examples/slack-gif-creator')
- Tận dụng lớp
GIFBuilder trong thư mục core/ của skill
- Lưu tệp vào
/mnt/user-data/outputs/
- Dùng hàm kiểm tra giới hạn kích thước của Slack (2MB)
check_slack_size() để xác nhận tuân thủ quy cách
- Nếu kích thước vượt quá giới hạn, mô hình có thể tự động thử tạo lại một tệp nhỏ hơn
Sự phụ thuộc vào môi trường của Skills
- Cơ chế Skills chỉ có thể hoạt động đầy đủ khi mô hình có thể truy cập
- Hệ thống tệp
- Công cụ duyệt hệ thống tệp
- Khả năng thực thi lệnh trong môi trường
- Đây là một mẫu phổ biến trong hệ công cụ LLM
- ChatGPT Code Interpreter là ví dụ quy mô lớn đầu tiên từ đầu năm 2023
- Sau đó mở rộng tới máy cục bộ thông qua các công cụ tác nhân lập trình như Cursor, Claude Code, Codex CLI, Gemini CLI
- Yêu cầu này là khác biệt lớn nhất so với các nỗ lực mở rộng năng lực LLM trước đó như MCP, ChatGPT Plugins
- Đây là một phụ thuộc quan trọng, nhưng quy mô năng lực mới được mở khóa thì lớn đến mức đáng kinh ngạc
- Vấn đề an toàn vẫn rất quan trọng
- Cần cung cấp môi trường lập trình an toàn
- Cần cách xây dựng môi trường sandbox để giới hạn thiệt hại từ các cuộc tấn công như prompt injection xuống mức chấp nhận được
Claude Code: tiến hóa thành tác nhân đa dụng
- Vào tháng 1/2025, tác giả từng dự đoán rằng “agent” sẽ thất bại, nhưng đã sai hoàn toàn
- Trên thực tế, 2025 đã trở thành năm của “agent” (dù có nhiều định nghĩa khác nhau, ở đây được định nghĩa là “tools in a loop”)
- Claude Code là một cái tên chưa chuẩn
- Nó không chỉ là công cụ lập trình thuần túy mà là công cụ tự động hóa máy tính đa dụng
- Có thể tự động hóa mọi tác vụ mà người ta có thể hoàn thành bằng cách nhập lệnh vào máy tính
- Mô tả nó là tác nhân đa dụng (general agent) là phù hợp nhất
- Skills khiến tiềm năng này trở nên rõ ràng và tường minh hơn nhiều
- Phạm vi ứng dụng rộng tới mức choáng ngợp
- Ví dụ về báo chí dữ liệu: có thể tổ chức một thư mục skill xử lý các việc sau
- Hiểu nguồn gốc và cấu trúc dữ liệu điều tra dân số Hoa Kỳ
- Nạp dữ liệu ở nhiều định dạng khác nhau vào SQLite/DuckDB bằng thư viện Python
- Xuất bản dữ liệu trực tuyến dưới dạng tệp Parquet trên S3 hoặc bảng Datasette Cloud
- Cách tìm ra những câu chuyện thú vị từ bộ dữ liệu mới (theo hướng dẫn của phóng viên dữ liệu giàu kinh nghiệm)
- Xây dựng trực quan hóa dữ liệu gọn gàng, dễ đọc bằng D3
- Kết quả: chỉ với các tệp Markdown và vài script Python mẫu, có thể xây dựng một “tác nhân báo chí dữ liệu” để phát hiện và xuất bản câu chuyện từ dữ liệu điều tra dân số Hoa Kỳ
So sánh Skills và MCP
- Model Context Protocol (MCP) đã thu hút sự quan tâm rất lớn kể từ khi ra mắt vào tháng 11/2024
- Mọi công ty đều cần một “chiến lược AI”, và việc công bố triển khai MCP là một cách dễ dàng để đáp ứng nhu cầu đó
- Dần dần, những giới hạn của MCP bắt đầu lộ rõ
- Vấn đề quan trọng nhất là mức sử dụng token
- MCP chính thức của GitHub tự nó đã tiêu tốn hàng chục nghìn token ngữ cảnh
- Chỉ cần thêm vài cái nữa là gần như không còn chỗ cho LLM làm việc hữu ích thực sự
- Kể từ khi bắt đầu nghiêm túc với các tác nhân lập trình, tác giả cũng ít quan tâm đến MCP hơn
- Gần như mọi thứ có thể đạt được bằng MCP đều có thể thay thế bằng công cụ CLI
- LLM biết cách gọi
cli-tool --help, nên không cần tốn nhiều token để giải thích cách dùng
- Mô hình có thể tự tìm hiểu khi cần
- Skills có đúng những ưu điểm đó, thậm chí còn hơn thế vì không cần phải triển khai cả một công cụ CLI mới
- Chỉ cần thả vào một tệp Markdown mô tả cách thực hiện công việc
- Chỉ thêm script khi nó giúp cải thiện độ ổn định hoặc hiệu quả
Triển vọng tăng trưởng bùng nổ của hệ sinh thái Skills
- Một trong những điểm thú vị nhất của Skills là rất dễ chia sẻ
- Nhiều skill được kỳ vọng sẽ chỉ là một tệp đơn
- Những skill tinh vi hơn sẽ ở dạng thư mục với vài tệp
- Tài liệu do Anthropic cung cấp
- Tác giả cũng đang lên ý tưởng cho các skill như cách xây dựng plugin Datasette
- Có thể dùng với các mô hình khác: đây là một ưu điểm lớn khác trong thiết kế của Skills
- Có thể gắn thư mục skill vào Codex CLI hoặc Gemini CLI rồi yêu cầu “hãy đọc pdf/SKILL.md và tạo cho tôi một file PDF giải thích dự án này”, và nó sẽ hoạt động
- Điều này khả thi ngay cả khi công cụ hay mô hình đó không có kiến thức tích hợp sẵn về hệ thống skill
- Dự đoán: sẽ có một vụ nổ kỷ Cambri của Skills khiến làn sóng MCP năm nay trở nên mờ nhạt
Sự đơn giản là sức mạnh cốt lõi
- Một số người phản ứng rằng Skills quá đơn giản nên khó gọi là một tính năng
- Nhiều người vốn đã thử nghiệm mẹo thêm chỉ dẫn vào tệp Markdown rồi cho tác nhân lập trình đọc nó
- AGENTS.md là một mẫu đã được thiết lập vững chắc, và hoàn toàn có thể chứa chỉ dẫn như “hãy đọc PDF.md trước khi tạo PDF”
- Chính sự đơn giản cốt lõi trong thiết kế của Skills là lý do khiến tác giả hào hứng
- MCP là cả một đặc tả giao thức hoàn chỉnh
- Host, client, server, resource, prompt, tool, sampling, root, elicitation
- Bao gồm ba phương thức truyền tải (stdio, streamable HTTP, ban đầu là SSE)
- Skills chỉ là Markdown + một ít siêu dữ liệu YAML + script thực thi tùy chọn
- Nó gần với tinh thần của LLM hơn nhiều: đưa văn bản vào và để mô hình tự xử lý
- Skills chuyển phần khó sang LLM harness và môi trường máy tính liên quan
- Đây là một chiến lược rất khôn ngoan nếu xét đến mọi điều đã học được trong vài năm qua về năng lực thực thi công cụ của LLM
12 bình luận
Có lẽ đây cũng là phần có thể được áp dụng khi dùng Claude Code cho việc lập trình. Hiện tại tôi cũng đang đưa hướng dẫn vào
Claude.mdvà tách riêng các hướng dẫn chi tiết để triển khai.Có vẻ như để thực hiện nhiều tác vụ với ít token, thay vì tối ưu hóa prompt thì có thể giải quyết khá đơn giản bằng cách tận dụng multi-agent và tóm tắt. Tôi đồng ý với vấn đề được nêu ra, nhưng cảm thấy cách giải quyết này cũng có những giới hạn nhất định.
Skills cũng dùng token phải không? Nếu vậy thì có vẻ vấn đề về mức sử dụng token sẽ lại phát sinh, nhưng đến lúc đó thì tôi không rõ sẽ ứng phó thế nào.
Có vẻ là không phải toàn bộ
SKILLS.mdđều được đưa vào context, mà lúc đầu luôn chỉ có phần tên và mô tả như bên dưới được đưa vào trước.name: skill-creator
description: Hướng dẫn để tạo các skill hiệu quả. Skill này nên được dùng khi người dùng muốn tạo một skill mới (hoặc cập nhật skill hiện có) nhằm mở rộng khả năng của Claude bằng kiến thức chuyên biệt, quy trình làm việc hoặc tích hợp công cụ.
license: Complete terms in LICENSE.txt
Khi làm việc với Claude Code, tôi cứ phải liên tục nhét các chỉ dẫn hay quy định vào context, rồi cuối cùng lại phải cân nhắc giữa lượng token sử dụng và context. Sau đó tôi nghĩ ra cách tạo thư mục, viết chi tiết vào đó bằng các file md theo từng chức năng, còn trong
claude.mdthì chỉ nhét thật nhiều pointer kiểu muốn làm gì thì xem cái nào; cách này hoạt động khá tốt mà chi phí cũng rẻ. Skills về bản chất chắc là tập hợp những thứ như vậy, nên có vẻ sẽ khá hữu ích.Và đúng như đã công bố, nếu sau này còn có cả skills marketplace nữa thì chỉ cần tải về những skill cần thiết, rồi bật lên khi cần dùng, như vậy có vẻ cũng khá ổn.
Ồ, cảm ơn vì phần giải thích cốt lõi.
Việc xử lý ngữ cảnh và Claude Skills có liên quan gì với nhau nhỉ? Ban đầu tôi đã nghĩ rằng: nó khác gì so với các custom command của Claude Code trước đây? Nhưng khi đọc tài liệu thì tôi cảm thấy điểm khác biệt lớn nhất có lẽ là việc có thể đưa cả mã script như Python hay JavaScript vào trong một skill và thực thi nó.
Ý kiến trên Hacker News
Với tôi, Claude Skills là bằng chứng cho thấy RAG đang bị làm cho khó một cách không cần thiết ở khía cạnh trải nghiệm người dùng. Vấn đề không nằm ở độ phức tạp kỹ thuật mà là UX. Nếu chỉ cần giải quyết tốt phần này thì có lẽ bản thân Claude Skills sẽ trở nên không cần thiết. Điểm hơn của Claude Skills so với MCP là dễ tạo hơn. Chỉ cần viết là có thể tạo, nên ai cũng dùng được. Nhưng nó phụ thuộc rất nhiều vào môi trường. Ví dụ, khi cần một công cụ cụ thể để chạy, thì thiết lập sandbox để tự động hóa việc đó sẽ làm thế nào? Thậm chí còn khó chắc được là có đúng phiên bản cần thiết hay không
Công ty chúng tôi cũng đang thử một thứ tương tự ở nội bộ. File ngữ cảnh của monorepo bên tôi quá lớn, nên chúng tôi đã xây dựng một cây fragment được nạp dần theo từng tác vụ. Những tài liệu ngữ cảnh này trông rất giống tài liệu dành cho lập trình viên truyền thống, nhưng thực tế hữu ích hơn nhiều và định hướng theo tác vụ hơn. Điều này khiến tôi tự hỏi vì sao trước đây chúng tôi lại không thể tạo ra kiểu tài liệu như vậy.
Về bản chất đây là vấn đề principal-agent pha thêm tính chất của marshmallow test. Nếu lập trình viên viết tài liệu cho người khác thay vì cho AI, họ không biết người đó là ai, cần gì, hay thậm chí có đọc nó hay không. Dĩ nhiên sau này chính họ cũng có thể được lợi, nhưng rất khó để hiểu điều đó hoặc duy trì thời gian và kỷ luật cần thiết. Nhưng nếu AI dùng tài liệu đó để trực tiếp giúp tôi, thì sẽ có động lực cực lớn và rất tức thời để ghi lại thông tin cần thiết. Đồng thời vòng lặp phản hồi cũng ngắn hơn. Nhân tiện, do đặc tính của LLM là comment trong code dễ bị xóa, nên dạo này tôi để lại nhiều tài liệu hơn và giảm mạnh comment
Lập trình viên mới thường không than phiền nhiều về tài liệu tệ vì sợ trông ngớ ngẩn. Người viết thì đã có sẵn mô hình trong đầu nên khó cảm nhận vấn đề, và viết tài liệu tốt từng là hành vi có thể khiến công việc của chính mình bị đe dọa. Nhưng nếu đưa tài liệu tệ cho một con robot ngốc và nó không làm được, thì mình buộc phải tự trách mình. Cuối cùng tôi nghĩ đây là #2 + #3. Nếu có thay đổi lớn, thì đó là việc “khả năng bị thay thế” đã chuyển từ điều tiêu cực sang tích cực (tự thay mình bằng tác nhân trước khi vị trí của mình bị tác nhân giá rẻ cướp mất)
Cũng tương tự lý do tồn tại technical debt: áp lực kinh doanh, thiết kế sai, thiếu nguồn lực. Trước đây việc liên tục duy trì tài liệu tốt mỗi lần thay đổi code thực sự rất tốn kém
Khi bảo hãy tưởng tượng có nhiều skills trong một thư mục, tôi lập tức nghĩ đến các tác vụ như xác định vị trí dữ liệu điều tra dân số Mỹ hoặc diễn giải cấu trúc của nó. Ngay lúc nghe vậy, tôi nhớ đến lần đầu dùng Wolfram Alpha. Khác với công cụ tìm kiếm thông thường, tôi đã bị choáng ngợp trước việc một công cụ thực sự có cấu trúc có thể giải quyết vấn đề. Giờ dùng lại vẫn thấy ấn tượng: Truy vấn dân số Mỹ bằng Wolfram Alpha. Mô hình Skills trong đầu tôi khá giống với việc thêm các phần mở rộng tùy biến vào Wolfram Alpha
Tôi bấm vào link bạn đăng thì thấy Wolfram Alpha mở truy vấn là
what%27s the total population of the United States%3F. Kết quả trả về khá buồn cười:6.1% mod 3 °F (2015-2019 American Community Survey 5-year estimates). Tôi tò mò không biết nó tính ra kiểu gìThành thật mà nói, Wolfram Alpha ngày xưa đúng là một thành tựu điên rồ. Đến giờ tôi vẫn thấy khó tin là thời đó, không có AI mà lại xây được một hệ thống xử lý cả các bài toán phức tạp như vậy
Tôi hơi lẫn lộn về khác biệt giữa Skills và các công cụ hiện có. Nhiều skills thực ra cũng có thể xem là công cụ, hoặc là tập hợp nhiều công cụ kèm mô tả. Nhưng chẳng phải định nghĩa tool và định nghĩa skill nằm ở hai chỗ khác nhau sao? Tôi muốn biết phải biểu diễn dependency giữa chúng thế nào. Nếu skill ghi là “cần dùng command line, python, tool A, tool B” thì có nghĩa là khi nạp skill, các công cụ đó cũng được kích hoạt cùng lúc sao?
Điều thực sự đáng chú ý là mọi người đều bị cuốn quá sâu vào MCP và hành xử theo quán tính phụ thuộc lối mòn. Thứ thực sự thú vị thật ra chỉ đơn giản là chính “tool call”. Tool call thực sự hữu ích và rất hay. MCP chỉ là một trong nhiều cách để làm điều đó. Mà cũng không phải cách xuất sắc gì
Tôi nghĩ việc MCP lan rộng mạnh đến vậy hoàn toàn là do thời điểm. Trước MCP thì tool calling cũng đã tồn tại, nhưng model chưa làm tốt. MCP xuất hiện đúng lúc các model bắt đầu giỏi hơn trong việc gọi công cụ. Vì vậy cốt lõi của làn sóng MCP là mọi người nhận ra rằng LLM có thể gọi công cụ để tương tác với các hệ thống khác
MCP server về bản chất là một registry để đăng ký tool call. Vậy thì nó kém hơn tool call thông thường ở điểm nào?
Điểm có ý nghĩa của MCP là nó dạy cho LLM khái niệm oauth. Nhờ vậy mới có thể gọi công cụ dựa trên server. Trước đây, cứ mỗi CLI muốn dùng là lại phải cài riêng rồi xử lý xác thực trong đó. Tôi đồng ý rằng tool calling là lợi thế lớn nhất của LLM, nhưng việc làm lộ ra thông điệp “phải quan tâm đến xác thực công cụ” cũng là một giá trị khá lớn
Nhân tiện, cũng xin nhắc rằng MCP là một tính năng mang tính đột phá do chính Anthropic tạo ra
Bỏ qua Skills thì tôi tò mò không biết nếu có cách nào tốt hơn MCP, thì đó sẽ là gì
Tầm ảnh hưởng của MCP rộng hơn terminal rất nhiều. Nó dùng được trong ChatGPT, Claude Web, n8n, LibreChat, và còn tính đến xác thực, tài nguyên, thậm chí cả UI (
apps-sdkchẳng hạn). Nếu tập trung vào workflow lập trình hay agent dựa trên CLI như Claude Code thì công cụ CLI vẫn cực kỳ có giá trị, nhưng ở các lĩnh vực như CRM, bán hàng, hỗ trợ, vận hành, tài chính thì công cụ dựa trên MCP là hình thức phù hợp hơn. Skills và MCP không phải quan hệ cạnh tranh mà là mục đích bổ trợ cho nhau. Đặc biệt, bước nhảy thực sự xảy ra khi code Python của Skills có thể gọi trực tiếp MCP qua interpreter (chúng tôi cũng đã thử và hoạt động rất tốt)Một trong những lợi thế lớn của MCP so với công cụ dựa trên terminal là nó có thể hoạt động mà không cần sandbox như môi trường Linux tách biệt hoàn toàn. Và còn dùng được với model đơn giản hơn nhiều. Ngay cả model chạy trên laptop hay thậm chí điện thoại cũng xử lý được hai ba MCP. Thành thật mà nói, bắt các model như vậy phải đọc file rồi
curlmột cách đáng tin cậy thì hơi quá sứcViệc tích hợp LLM với phần mềm bên ngoài hoặc thế giới vật lý dạo này thật sự rất ngầu. Tất cả đều thực hiện được bằng ngôn ngữ tự nhiên. Thậm chí LLM còn có thể tạo ra mã MCP server, nên việc tạo năng lực hoàn toàn mới cũng trở nên dễ dàng
Thành thật mà nói, tôi nghĩ MCP đang bị đánh giá quá cao và giới hạn của nó cũng rất rõ. 95% MCP server hiện nay là vô dụng, hoàn toàn có thể thay bằng tool call đơn giản
Điều hiển nhiên là MCP server được làm tốt thì thật sự rất tốt. Ngược lại, MCP server cẩu thả còn gây ra vấn đề nghiêm trọng hơn. Thường thì mọi đội sản phẩm đều bị ép phải làm MCP server chỉ vì “MCP đang hot”. Khách hàng cũng luôn có mục tiêu nào đó liên quan đến AI nên sẽ đòi hỏi kiểu này. Nhưng thực ra họ không biết mình muốn gì, chỉ cần nói “có AI” là được. Vì vậy đội sản phẩm cũng không có hiệu quả áp dụng AI rõ ràng, nhưng nhờ MCP mà có thể quảng bá rất nhanh rằng “chúng tôi là sản phẩm AI”. Đây là hiện tượng không liên quan mấy đến bản chất của AI
MCP chỉ dùng được nếu bạn tin tưởng nhà cung cấp server. Về cơ bản là phụ thuộc vào sự trung thực của server. Trên thực tế, những công ty như Uber chắc chắn sẽ dùng đủ loại prompt engineering để liên tục dẫn LLM đến chỗ nghĩ rằng dịch vụ của họ là lựa chọn tốt nhất. Cuối cùng, incentive giữa publisher và consumer của MCP là hoàn toàn lệch nhau
Tôi đồng ý rằng tool call mới là cốt lõi. Nhưng MCP có ít nhất hai ưu điểm so với CLI. Một là khi xây các tương tác phức tạp mà LLM gọi tool phải yêu cầu output có cấu trúc, MCP dễ hơn CLI. Hai là state giữa các lần tool call có thể được giữ lại một cách tự nhiên trong MCP server. Ban đầu tôi cũng nghĩ có lẽ mình bị hype cuốn theo quá dễ, nhưng demo nhỏ gần đây tôi làm để học MCP (https://github.com/cournape/text2synth) dễ hơn làm bằng CLI, và tôi nghĩ đây là ví dụ thể hiện khá tốt những khả năng ứng dụng thú vị của MCP
MCP server có vẻ cực kỳ được giới hacker ưa chuộng. Có quá nhiều instance được cấu hình kém và triển khai qua loa. Các công ty gần như đang xóa bỏ mọi tuyến phòng thủ triển khai vốn có
Đội frontend của chúng tôi khai thác giá trị rất lớn từ figma MCP. Việc lẽ ra mất 3 tuần đã xong trong 1 ngày
Tôi cũng đã làm được thứ gần ngang skills chỉ bằng vài file markdown. Mỗi session chỉ cần nhắc agent về skill một lần là đủ. Tôi không hiểu Claude làm việc này thì có gì đặc biệt
Việc đặt tên cho một dạng pattern là phần quan trọng. Đây vốn đã là một pattern hữu ích mà nhiều người tự nhiên phát hiện ra và dùng, nhưng khi có tên thì có thể thảo luận ở mức cao hơn. Anthropic còn nhận ra pattern này đặc biệt giúp giải quyết vấn đề cố hữu của coding agent là “ô nhiễm context”. Trước đây
AGENTS.mdhay MCP nhồi quá nhiều thông tin vào ngữ cảnh nên thiếu thực tế, còn pattern skills thì hiệu quả hơn nhiềuCảm giác như chỉ là chính thức hóa một vấn đề đã được giải quyết, rồi cấu trúc hóa và thêm chút tự động hóa. Trong số các MCP tôi từng dùng trước đây, nhiều cái chỉ là chức năng tìm kiếm tài liệu kiểu fancy, nên tôi kỳ vọng các skills kiểu này sẽ thay thế được chúng
Tôi cũng có cùng thắc mắc. Tôi đã dùng kiểu này hơn 1 năm với Aider và CC
Có thể hơi tiêu cực, nhưng tôi muốn xem có ai cũng cảm thấy giống vậy không. Nếu bắt người dùng trung bình phải tự thiết lập các dịch vụ kiểu này, họ sẽ nghĩ “bị điên à”. Đa số chỉ muốn đăng nhập, yêu cầu gì đó rồi hệ thống tự lo phần còn lại. MCP, Apps, Skills, Gems... đều đang giải sai bài toán. Nó giống các kênh YouTube cứ mỗi 6 tháng lại nói “ngôn ngữ lập trình hay framework mới là số một”, rồi làm ứng dụng todo, lặp tối đa 6 lần cùng một video. Chỉ có những cải tiến bề mặt mang tính lặp lại, còn vấn đề gốc vẫn không được giải quyết. Có gì đó trong một nhánh công nghệ nào đó đang đi sai, và khi tiền đổ vào thì chỉ toàn những màn công bố như vậy, rồi lại ra bản phát hành tiếp theo, thăng chức, nhảy việc, nhưng chẳng để lại giá trị cốt lõi nào
Nói về ý kiến cho rằng vấn đề gốc không được giải quyết, thì dạo này các giải pháp còn đóng gói sẵn cả vấn đề mới. Mở hộp ra là vấn đề và giải pháp cùng bật ra, vừa đuổi nhau vừa chạy trốn nhau. Và mình lại có cảm giác như bản thân đã trở thành một con người tiến bộ hơn về công nghệ
Về chuyện MCP, Apps, Skills, Gems đều đang nghĩ sai bài toán, theo góc nhìn bi quan của tôi, chúng ta đang tạo thêm tài liệu và API cho AI, trong khi nếu tạo tài liệu cho con người thì có lẽ kết quả cũng gần tương tự. Một nửa thời gian của tôi bị kéo vào việc debug các hệ thống phức tạp không có tài liệu
Tôi tò mò “vấn đề gốc” là gì, và trước khi ChatGPT bùng nổ với công chúng vào năm 2023 thì chu kỳ giải quyết những “vấn đề gốc” như vậy là bao lâu
Lấy ví dụ câu “làm cùng một ứng dụng todo 6 lần rồi quên đi”, tôi không thấy đó là vấn đề gì. Công nghệ vốn dĩ tiến bộ dần dần và lặp đi lặp lại. Ngày mai sẽ lại có ai đó đăng video nói framework frontend nào là tốt nhất, trước đó là Nextjs, trước nữa là React, Angular, JQuery, PHP, HTML, cũng đều như vậy. Nếu đạn không dồn hết vào AI thì có lẽ chúng ta vẫn mắc kẹt ở GPT-3 và Claude 2. Về mặt công cụ, đôi khi cũng có thứ khá tệ (dù tôi nghĩ Skills khá ổn), nhưng nhìn vậy rồi bảo cả ngành đã thối rữa thì tôi không đồng ý
Nói gì thì nói, mọi thứ vẫn đang ở giai đoạn đầu và chưa ai thật sự biết cái gì có hiệu quả. Trông có vẻ là các thử nghiệm bề mặt, nhưng thực ra đó lại chính là tuyến đầu công nghệ
Đây là hai khái niệm hoàn toàn khác nhau. MCP là để kết nối dịch vụ bên ngoài, bao gồm cả xử lý xác thực như oauth. Skills về bản chất là tổ hợp công cụ CLI + prompt. Phạm vi ứng dụng khác nhau nên khó so sánh trực tiếp. Nhân tiện, trước khi MCP xuất hiện, chúng tôi cũng từng tự làm một hệ thống tên là Skillset, và nhìn lại thì tôi thấy đó là dạng hybrid tốt nhất, kết hợp ưu điểm của cả MCP lẫn Skills
Làm quá lên thật đấy