5 điểm bởi GN⁺ 2026-01-28 | 1 bình luận | Chia sẻ qua WhatsApp
  • Môi trường thực thi container của ChatGPT đã được mở rộng đáng kể, giờ đây có thể chạy lệnh Bash, cài gói pip/npmtải tệp xuống
  • Môi trường trước đây tập trung vào Python nay đã bổ sung hơn 10 ngôn ngữ như Node.js, Ruby, Go, Java, Swift, Kotlin, C, C++ để hỗ trợ thực thi mã đa ngôn ngữ
  • Quyền truy cập mạng bên ngoài vẫn bị hạn chế, nhưng được cấu hình để pip installnpm install hoạt động thông qua proxy nội bộ của OpenAI
  • Công cụ mới container.download có thể lấy tệp từ URL công khai và lưu vào bên trong container, đồng thời đi qua quy trình kiểm tra bảo mật
  • Bản nâng cấp này mở rộng đáng kể khả năng chạy mã và xử lý dữ liệu của ChatGPT, đồng thời nhấn mạnh nhu cầu cần có tài liệu chính thức

Các mở rộng chính của container ChatGPT

  • ChatGPT hiện có thể chạy trực tiếp lệnh Bash, trong khi trước đây chỉ chạy được mã Python
    • Không còn phải thực thi gián tiếp thông qua mô-đun subprocess của Python, mà có thể điều khiển ở cấp dòng lệnh
  • Môi trường Node.js đã được bổ sung, cho phép chạy JavaScript; ngoài ra Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ cũng đã được kiểm thử thành công
    • Rust vẫn chưa được hỗ trợ
  • Container vẫn không thể trực tiếp thực hiện các yêu cầu mạng ra bên ngoài, nhưng pip installnpm install hoạt động qua proxy
  • Có thể dùng công cụ container.download để tải tệp trên web về đường dẫn chỉ định
    • ChatGPT có thể nhận diện URL, lưu tệp đó vào môi trường sandbox rồi xử lý tiếp

Tính năng container.download

  • container.download là công cụ lấy tệp từ URL có thể truy cập công khai và lưu vào hệ thống tệp của container
  • Tệp đã tải về có thể được giải nén, phân tích, chuyển đổi và hậu xử lý bên trong container
  • Theo kết quả thử nghiệm, phần đầu yêu cầu có chứa User-Agent: ChatGPT-User/1.0, và IP được xác nhận là Microsoft Azure Cloud (Des Moines, Iowa)

Kiểm chứng bảo mật: có khả năng rò rỉ dữ liệu hay không

  • Đã tiến hành thử nghiệm xem container.download có thể trở thành lỗ hổng rò rỉ dữ liệu hay không
    • Khi gọi URL có chứa chuỗi truy vấn, xuất hiện lỗi “url not viewed in conversation before
    • Đây là cơ chế an toàn giới hạn truy cập URL, tương tự Web Fetch của Claude, chỉ cho phép truy cập các URL đã được xác nhận thông qua đầu vào người dùng hoặc kết quả tìm kiếm
  • Có thể truyền một phần chuỗi truy vấn thông qua web.run, nhưng các chuỗi dài bao gồm lịch sử hội thoại trước đó bị bộ lọc chặn lại
  • Theo các thử nghiệm hiện tại, rủi ro rò rỉ dữ liệu được đánh giá là thấp, dù vẫn cần thêm nghiên cứu bảo mật

Chạy Bash và đa ngôn ngữ

  • Nhờ hỗ trợ chạy Bash, ChatGPT có thể thực hiện các lệnh ở cấp hệ thống
    • Ví dụ: có thể chạy lệnh npm install và kiểm tra kết quả
  • Có thể xác minh việc lệnh có thực sự được thực thi hay không qua nhật ký chạy trong bảng Activity (log console đen trắng)
  • Thử nghiệm chạy “Hello World” trên nhiều ngôn ngữ đã thành công, xác nhận đây là môi trường thực thi mã đa ngôn ngữ

Cơ chế cài gói pipnpm

  • Dù container bị chặn truy cập mạng bên ngoài, việc cài gói vẫn được thực hiện thông qua proxy nội bộ của OpenAI (applied-caas-gateway1.internal.api.openai.org)
    • Các biến môi trường như PIP_INDEX_URL, NPM_CONFIG_REGISTRY đều trỏ tới proxy này
  • Các trình quản lý gói chính như pip, uv, npm đều hoạt động qua proxy nói trên
  • Trong biến môi trường có nhiều đường dẫn registry với tiền tố CAAS_ARTIFACTORY_*
    • Tồn tại nhiều đường dẫn kho lưu trữ nội bộ cho PyPI, npm, Go, Maven, Gradle, Cargo, Docker...
  • Rust và Docker hiện vẫn chưa được cài sẵn, nhưng gợi mở khả năng mở rộng trong tương lai

Khai thác tích hợp và các bài toán tiếp theo

  • ChatGPT giờ đây có thể cài gói Python và Node.js rồi áp dụng cho các tệp được tải lên hoặc tải xuống
  • Từ viết mã, thực thi, xử lý dữ liệu đến nhập/xuất tệp, hệ thống đã đạt tới mức của một môi trường phát triển hoàn chỉnh
  • Thiếu sót lớn nhất là chưa có tài liệu chính thức, nên cần công bố release note và các giới hạn chi tiết
  • OpenAI cần đặt tên phù hợp cho nhóm tính năng này; hiện tạm được gọi là “ChatGPT Containers

Tóm tắt toàn bộ danh sách công cụ của ChatGPT

  • Danh sách các công cụ khả dụng trong môi trường GPT-5.2 đã được công bố
    • Bao gồm python.exec, web.run, container.exec, container.download, image_gen.text2im...
  • Mỗi công cụ đều có mô tả (description)chữ ký (signature) rõ ràng
  • container.exec dùng để chạy lệnh, container.feed_chars để nhập vào phiên tương tác, container.open_image để hiển thị ảnh
  • Cũng bao gồm các tính năng cá nhân hóa người dùng như bio.update, personal_context.search, user_settings.set_setting
  • Nhìn chung, ChatGPT đang tiến hóa thành một môi trường AI tích hợp, kết hợp thực thi mã, truy cập web, xử lý tệp và quản lý ngữ cảnh người dùng

1 bình luận

 
GN⁺ 2026-01-28
Ý kiến trên Hacker News
  • Tôi làm trong bộ phận hỗ trợ kỹ thuật, quen với Python nhưng không phải là lập trình viên
    Nhưng trong vài tuần gần đây, Gemini và Claude đã hỏi tôi rằng “bạn có thể dùng máy tính không?”
    Tôi hỏi lại: “Máy tính nào? Máy của tôi? Hay máy của các bạn?”
    Vì đang dùng phiên bản trình duyệt miễn phí nên tôi không nghĩ chúng có thể trực tiếp dùng máy của tôi, nhưng hóa ra chúng đang chạy script Python trong môi trường riêng của chúng
    Điều đó khiến tôi tò mò không biết ai là người đầu tiên nghĩ ra ý tưởng cung cấp một máy tính thực sự cho LLM để giải các bài toán tính toán
    Ngoài ra, khi chạy Nano Banana bằng prompt, Gemini lại nhắc đến trình tạo ảnh ở ngôi thứ ba, tạo cảm giác như “rùa chồng lên rùa”

  • Theo kinh nghiệm của chúng tôi, cấp cho agent một môi trường Linux mang lại nhiều lợi ích kết hợp
    Nó tự xử lý được những tình huống kỳ quặc mà công cụ thông thường khó giải quyết
    Ví dụ, khi một file được đặt tên là .png nhưng thực ra là jpeg, nó sẽ đọc magic byte và xử lý đúng cách

    • Tôi cũng từng có trải nghiệm tương tự trong quy trình print-on-demand
      Tôi đã thử dùng mô hình vision để kiểm tra ICC profile hay mật độ mực, nhưng nó thường nói linh tinh
      Cuối cùng tôi phải cấp cho agent quyền truy cập ImageMagick để tự phân tích, và đó là cách duy nhất đáng tin cậy
      Nếu không thì tôi sẽ là người phải gánh chi phí các bản in bị lỗi
    • Thực ra việc đọc magic byte là chức năng khá đơn giản
      Hầu hết trình xem hoặc chỉnh sửa ảnh trên Linux đều đã xác định định dạng file bằng magic byte thay vì phần mở rộng
      Tôi nghĩ thiết kế phụ thuộc phần mở rộng của Microsoft là nguyên nhân tạo ra kiểu vấn đề này
    • Tôi không chắc đây có phải việc đặc biệt đến mức cần LLM làm hay không
      Với con người thì chỉ là việc có thể làm trong vài giây bằng các công cụ Unix thông thường
  • ChatGPT bản cơ bản giờ cũng có thể chạy code bằng Node.js, Ruby, Perl, PHP, Go, Java, Swift, Kotlin, C, C++ và nhiều ngôn ngữ khác
    Không thấy trong ghi chú phát hành chính thức, nhưng đã xác nhận là dùng được cả với tài khoản miễn phí

    • Tôi đã có thể cung cấp file .deb để cài trình biên dịch DMD cho ngôn ngữ D
      Liên kết chia sẻ
    • Đáng tiếc là C# không có trong danh sách
  • Tôi khá bất ngờ khi thấy các mục như “gmail (read-only)”
    Ứng dụng ChatGPT trên Android nói rằng nó không có quyền như vậy, nên tôi tò mò quyền đọc Gmail khả dụng trong ngữ cảnh nào

  • Dạo này có vẻ mọi công ty đều đang cạnh tranh để khóa tính năng tool calling vào trong nền tảng của riêng mình
    Cuối cùng, nếu mô hình có thể làm gần như mọi việc trong môi trường cục bộ thì tranh luận về sandbox cũng sẽ bớt ý nghĩa
    Tôi tò mò không biết đến bao giờ họ mới cung cấp môi trường phát triển ảo bền vững

    • Tôi đang làm dự án vibebin,
      và tôi vẫn nghĩ việc vận hành công cụ AI coding hay agent trong môi trường cô lập là rất có giá trị
      Có lẽ phần lớn lập trình viên sẽ dùng các công cụ coding chuyên biệt như vậy thay vì giao diện web GPT thông thường
    • Claude Code for the web về cơ bản đã là một dạng môi trường phát triển ảo bền vững
      Bạn bắt đầu một phiên, làm việc rồi quay lại sau một ngày thì trạng thái hệ thống file vẫn được giữ nguyên
      Có lẽ nó dùng object storage để giảm chi phí
      Nhân tiện, bài viết về thiết kế của Sprites.dev trên Fly cũng rất đáng xem
    • Có lẽ vì xu hướng này mà Anthropic đã mua lại Bun
    • Nhiều công ty đang đi theo hướng đó
      Thay vì phần cứng cục bộ thì chỉ giữ lại thin client, còn workload thực tế giao cho những nơi như Microsoft
      Cá nhân tôi thấy không có môi trường phát triển cục bộ thì đúng là địa ngục, nhưng có vẻ xu thế đang đi theo hướng đó
  • Tính năng này hoặc sẽ tiết kiệm cực nhiều thời gian, hoặc sẽ tạo ra một kiểu sự cố học tập

    • Nếu agent có thể tự cập nhật mô hình, thì đó sẽ chỉ là quá trình học cho chính mô hình mà thôi
  • Khả năng phát hiện như thám tử của Simon thật tuyệt
    Những kiểu “bài viết khám phá” như thế này thú vị hơn nhiều so với thông báo chính thức

    • Đúng vậy, có một nguồn năng lượng sáng tạo xuất hiện khi mọi người tự mình tìm ra rồi chia sẻ
      Nó truyền cảm hứng hơn rất nhiều so với một thông cáo báo chí đơn thuần
  • Có lẽ sắp tới ChatGPT sẽ bước vào thời kỳ tự tạo ứng dụng dùng một lần ngay tại chỗ
    Nó sẽ tạo ứng dụng sandbox trên đám mây trong trình duyệt để hoàn thành mục tiêu, rồi xong là bỏ ngay

    • Đã có những ví dụ triển khai kiểu tính năng này
    • Chẳng hạn đã có các lựa chọn thay thế như exe.dev hay sprites.dev