Đánh giá Code Interpreter mới của Claude, ra mắt với một cái tên cực kỳ khó hiểu

(simonwillison.net)

7 điểm bởi GN⁺ 2025-09-10 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Bài đánh giá dựa trên trải nghiệm sử dụng thực tế tính năng “Upgraded file creation and analysis” của Anthropic, chỉ ra bản chất của nó như một công cụ phân tích có khả năng thực thi mã bởi Simon Willison
Tính năng mới này hỗ trợ chạy mã Python·Node.js trong container phía máy chủ cùng khả năng tạo và chỉnh sửa tệp, hoàn toàn khác về cách triển khai so với ‘Analysis tool’ dựa trên JS chạy trong trình duyệt trước đây
Container cung cấp Ubuntu 24.04.2, Python 3.12.3, Node v18.19.1, khoảng 9GB RAM/5GB đĩa, đồng thời có các đặc điểm như whitelist mạng dựa trên proxy Envoy và cho phép cài gói từ PyPI
Trong các bài thử nghiệm thực tế, tác giả đã tạo PDF sơ đồ schema SQLite và tái hiện biểu đồ tỷ lệ ứng dụng AI của Apollo, cho thấy có thể nâng cao chất lượng kết quả thông qua thiết kế prompt và tinh chỉnh trực quan hóa
Việc truy cập Internet một phần kéo theo rủi ro prompt injection và rò rỉ dữ liệu, nên cần giám sát người dùng; đồng thời, thất bại trong việc đặt tên và mô tả tính năng vẫn là bài toán chung của toàn ngành

Tổng quan tính năng

Anthropic công bố Claude hỗ trợ khả năng tạo và chỉnh sửa tệp
- Có thể tạo bảng tính Excel, tài liệu Word, slide PowerPoint, PDF trên Claude.ai và ứng dụng desktop
- Người dùng chỉ cần tải dữ liệu lên hoặc mô tả yêu cầu để nhận được tệp sẵn sàng sử dụng ngay
Đang ở giai đoạn preview cho người dùng gói Max, Team, Enterprise, và gói Pro dự kiến được hỗ trợ trong vài tuần tới
Tính năng chính:
- Phân tích dữ liệu: làm sạch dữ liệu thô và cung cấp phân tích thống kê, biểu đồ, cùng các insight chính
- Tạo bảng tính: sinh mô hình tài chính, công cụ theo dõi dự án, mẫu ngân sách kèm công thức
- Làm việc đa định dạng: chuyển PDF sang PowerPoint, sắp xếp ghi chú cuộc họp thành tài liệu, v.v.
Tác giả Simon Willison xem đây là tính năng tương ứng với ChatGPT Code Interpreter, và đánh giá tên chính thức “Upgraded file creation and analysis” là cách đặt tên không phù hợp
Khác biệt so với tính năng trước đó
- Analysis tool vào tháng 10/2024 là công cụ phân tích nhẹ theo kiểu chạy JS trong trình duyệt người dùng
- Tính năng mới tháng 9/2025 là một Code Interpreter thực thụ, chạy lệnh shell·Python·Node.js trong container phía máy chủ và thực hiện đọc/tạo tệp
- Nó tương tự Code execution tool trong API của cùng công ty, nhưng đây là lần đầu người dùng cuối có thể chạy mã tùy ý trong container máy chủ

Đặc điểm của Code Interpreter mới

Code Interpreter của Claude có cách hoạt động tương tự ChatGPT Code Interpreter
Có thể cài gói Python từ PyPI (ví dụ: pip install sqlite-utils)
- Node.js v18.19.1 được cài sẵn, có thể dùng các gói npm global
Chi tiết môi trường:
- OS: Ubuntu 24.04.2 LTS, nhân Linux 4.4.0
- Kiến trúc: x86_64, shell: GNU Bash 5.2.21
- Python: 3.12.3, pip: 24.0
- Ổ đĩa: 4.9GB (khả dụng 4.6GB), RAM: 9.0GB
Hạn chế: giới hạn 30MB tải lên/tải xuống tệp, dung lượng hạn chế hơn so với 512MB của ChatGPT
- Truy cập Internet: áp dụng whitelist nghiêm ngặt dưới proxy Envoy
- curl đến các trang phổ thông (ví dụ: google.com) sẽ trả về lỗi 403 Forbidden
- Các domain được phép gồm api.anthropic.com, github.com, registry.npmjs.org / npmjs.com, pypi.org / files.pythonhosted.org... tức là whitelist chủ yếu xoay quanh quản lý gói và phiên bản
- Có thể cài gói từ PyPI như pip install sqlite-utils, và runtime Node cũng dùng được ngay
- Có thể truy cập nội dung web ở mức hạn chế thông qua container web_fetch, web_search

Thiết lập và cách dùng

Kích hoạt: bật toggle Upgraded file creation and analysis tại claude.ai/settings/features
- Không thể bật đồng thời với Analysis Tool, nhằm tránh gây nhầm lẫn
Bài toán đơn giản: SQLite → PDF sơ đồ join
- Đầu vào: tải lên DB SQLite của trang TIL (≈21.9MB) rồi yêu cầu tạo PDF sơ đồ join giữa các bảng
- Kết quả: tạo thành công PDF/PNG; độ dễ đọc của các đường nối chưa thực sự tốt nhưng có thể cải thiện bằng bổ sung prompt
- Ý nghĩa: quy trình phân tích tệp DB đã tải lên bằng Python rồi tạo ảnh/PDF như một workflow Code Interpreter tiêu chuẩn hoạt động mượt mà
Bài toán khó: tái hiện biểu đồ tỷ lệ ứng dụng AI
- Bài toán: dùng ảnh chụp màn hình + XLSX làm đầu vào và yêu cầu tái hiện biểu đồ đường chuỗi thời gian giống bản gốc
- Quá trình:
  - Kết quả lần đầu còn thô về mặt trực quan như nối đường thẳng, chồng lấn nhãn
  - Khi yêu cầu áp dụng moving average khảo sát 6 kỳ, đường xu hướng được cải thiện
  - Việc nêu rõ yêu cầu “nội suy đường cong thay vì đường thẳng” giúp render thành đường cong mượt hơn, còn phần tiêu đề chồng lấn được chỉnh tiếp bằng prompt bổ sung
- Hàm ý: khi kết hợp prompt thân thiện với mô hình và tinh chỉnh tham số trực quan hóa, có thể đạt năng suất tương đương ChatGPT

Bảo mật và rủi ro prompt injection

Do có truy cập Internet, tồn tại rủi ro tấn công prompt injection
- Lệnh độc hại có thể được chèn qua tệp hoặc website
- Ví dụ: thực thi mã không đáng tin cậy, rò rỉ dữ liệu nhạy cảm
Anthropic đã tiến hành red teaming và kiểm thử bảo mật, đồng thời khuyến nghị theo dõi người dùng
- Việc cho phép GitHub làm tăng lo ngại về các vector rò rỉ dữ liệu
Khuyến nghị: thận trọng khi dùng dữ liệu nhạy cảm, và dừng ngay nếu phát hiện truy cập dữ liệu bất thường

Đánh giá khả năng sử dụng·chất lượng

Claude Code Interpreter cung cấp năng lực có thể vượt ChatGPT Code Interpreter
Ưu điểm
- Cho phép cài PyPI + hỗ trợ Node nên có độ mở rộng hệ sinh thái công cụ rất tốt
- Có thể thực hiện trọn vẹn pipeline tương tác từ tạo/chuyển đổi tệp/ trực quan hóa trong một lần
Hạn chế
- Giới hạn tệp 30MB gây cản trở với dataset lớn hoặc upload DB dung lượng cao
- Với một số dạng trực quan hóa, có thể cần lặp lại prompt bổ sung để tinh chỉnh chi tiết
Giá trị: Code Interpreter là một trong những tính năng hữu ích nhất của LLM, và bản nâng cấp của Claude làm tăng thêm kỳ vọng

Bài toán đặt tên·giao tiếp

Anthropic: tiếp nối tên gọi Analysis tool trước đây bằng cái tên còn gây khó hiểu hơn là “Upgraded file creation and analysis”, đồng thời khả năng thực thi mã lại bị che khuất trong tài liệu ra mắt
OpenAI: cũng từng có tiền lệ dao động cách gọi giữa Code Interpreter ↔ Advanced Data Analysis, và độ hiển thị của trang landing chính thức cũng không cao
Kết luận: toàn ngành đang liên tục thất bại trong việc truyền đạt giá trị cốt lõi của kiểu công cụ tạo và phân tích tệp bằng thực thi mã, và cần cải thiện thuật ngữ lẫn hướng dẫn để tăng mức độ hiểu và niềm tin của người dùng

Đánh giá Code Interpreter mới của Claude, ra mắt với một cái tên cực kỳ khó hiểu

Tổng quan tính năng

Đặc điểm của Code Interpreter mới

Thiết lập và cách dùng

Bài toán đơn giản: SQLite → PDF sơ đồ join

Bài toán khó: tái hiện biểu đồ tỷ lệ ứng dụng AI

Bảo mật và rủi ro prompt injection

Đánh giá khả năng sử dụng·chất lượng

Bài toán đặt tên·giao tiếp

Bài viết liên quan

Chưa có bình luận nào.