12 điểm bởi GN⁺ 2026-02-03 | 8 bình luận | Chia sẻ qua WhatsApp
  • Quản lý nhiều AI agent cùng lúc và hỗ trợ làm việc song song cùng cộng tác dài hạn trong một môi trường phát triển tích hợp cho AI agent
  • Mỗi agent chạy trong một luồng độc lập, cho phép đa nhiệm theo từng dự án, review code, bình luận trên diff và chỉnh sửa thủ công
  • Thông qua tính năng Skills, phạm vi được mở rộng từ viết mã sang nhiều tác vụ khác như thu thập thông tin, giải quyết vấn đề, tạo hình ảnh, soạn tài liệu và triển khai đám mây
  • Với tính năng Automations, có thể tự động thực hiện các tác vụ lặp lại trong nền theo lịch đã định
  • Mặc định áp dụng bảo mật sandbox; các lệnh cần quyền cao hơn như truy cập mạng phải được người dùng phê duyệt
  • Codex cũng tạm thời được cung cấp cho người dùng ChatGPT Free và Go; các gói trả phí được tăng gấp đôi giới hạn sử dụng

Tổng quan về ứng dụng Codex: trung tâm chỉ huy cho agent

  • Kể từ khi Codex ra mắt vào tháng 4/2025, cách các nhà phát triển sử dụng agent đã thay đổi một cách căn bản
    • Mô hình giờ đây có thể xử lý các tác vụ phức tạp và dài hạn từ đầu đến cuối
    • Các nhà phát triển hiện có thể điều phối nhiều agent trên toàn bộ dự án, giao việc và chạy song song
  • Thách thức cốt lõi đã chuyển từ “agent có thể làm gì” sang “con người có thể chỉ huy, giám sát và cộng tác với agent ở quy mô lớn như thế nào”
  • IDE hiện có và các công cụ dựa trên terminal không được thiết kế để hỗ trợ cách làm việc này, nên cần công cụ mới
  • Ứng dụng Codex cho macOS cho phép quản lý nhiều AI agent đồng thờithực thi công việc song song
  • Hỗ trợ các tác vụ chạy dài hạn, đồng thời quản lý toàn bộ quy trình thiết kế, phát triển, triển khai và bảo trì phần mềm thông qua sự cộng tác giữa các agent

Làm việc song song với nhiều agent

  • Ứng dụng Codex cung cấp không gian tập trung cho đa nhiệm với agent
    • Agent chạy trong các luồng riêng biệt được cấu hình theo từng dự án, giúp chuyển đổi giữa các công việc mà không mất ngữ cảnh
    • Trong luồng, có thể xem lại các thay đổi của agent, thêm bình luận vào diff hoặc chỉnh sửa trực tiếp trong editor
  • Hỗ trợ Worktrees mặc định để nhiều agent có thể làm việc trên cùng một repository mà không xung đột
    • Mỗi agent làm việc trên một bản sao mã cô lập, cho phép khám phá nhiều hướng khác nhau mà không ảnh hưởng đến trạng thái git cục bộ
    • Trong khi agent đang làm việc, có thể checkout thay đổi cục bộ hoặc tiếp tục công việc mà không làm thay đổi trạng thái git cục bộ
  • Tự động nhập lịch sử phiên và cài đặt từ Codex CLI và extension IDE, cho phép dùng ngay trong các dự án hiện có

Skills: mở rộng vượt ra ngoài tạo mã

  • Codex đang tiến hóa từ một agent viết mã thành một agent thực hiện công việc trên máy tính bằng mã
  • Thông qua Skills, có thể mở rộng sang các tác vụ vượt ngoài tạo mã như thu thập và tổng hợp thông tin, giải quyết vấn đề, viết lách
    • Có thể đóng gói hướng dẫn, tài nguyên và script để Codex kết nối công cụ và thực thi workflow
    • Hoàn thành công việc một cách ổn định theo sở thích của từng nhóm
  • Ứng dụng Codex bao gồm giao diện chuyên dụng để tạo và quản lý Skills
    • Có thể yêu cầu rõ ràng sử dụng một Skill cụ thể hoặc thiết lập để tự động dùng tùy theo tác vụ
  • Ví dụ sử dụng Skills: tạo game đua xe

    • Yêu cầu Codex tạo một game đua xe với nhiều tay đua khác nhau, 8 bản đồ và vật phẩm có thể dùng bằng phím cách
      • Sử dụng kỹ năng tạo hình ảnh (dựa trên GPT Image) và kỹ năng phát triển web game
      • Hoàn thành trò chơi bằng cách làm việc độc lập với hơn 7 triệu token chỉ từ một prompt ban đầu duy nhất
      • Đảm nhiệm vai trò nhà thiết kế, lập trình viên game và QA tester, đồng thời thực sự chơi game để kiểm chứng
    • Tên game: Voxel Velocity, game đua kart voxel 3D sử dụng Three.js
      • Chế độ đua đơn (luôn 3 vòng, 1 người chơi vs 7 CPU, có sẵn ngay 8 đường đua)
      • Mô hình lái arcade, hệ thống drift charge, các mức boost (Tier 1 0.7 giây, Tier 2 1.1 giây, Tier 3 1.5 giây)
      • 8 nhân vật, 8 vật phẩm, preset độ khó CPU, triển khai AI spline
  • Các Skills chính được cung cấp

    • Implement designs: lấy ngữ cảnh thiết kế, asset và screenshot từ Figma rồi chuyển thành mã UI production có độ tương đồng hình ảnh 1:1
    • Manage projects: phân loại bug, theo dõi phát hành và quản lý khối lượng công việc nhóm trong Linear
    • Deploy to the cloud: triển khai web app lên các nền tảng cloud host lớn như Cloudflare, Netlify, Render, Vercel
    • Generate images: tạo và chỉnh sửa hình ảnh cho website, mockup UI, hình ảnh sản phẩm và asset game bằng kỹ năng tạo ảnh dựa trên GPT Image
    • Build with OpenAI APIs: tham chiếu tài liệu mới nhất khi xây dựng bằng OpenAI API
    • Create documents: đọc, tạo và chỉnh sửa file PDF, spreadsheet, docx (hỗ trợ định dạng và bố cục chuyên nghiệp)
    • Khi tạo Skill mới trong app, có thể dùng ở app, CLI và extension IDE
    • Có thể check-in Skill vào repository để chia sẻ cho cả nhóm sử dụng

Automations: tự động hóa tác vụ lặp lại

  • Với tính năng Automations, Codex tự động thực hiện công việc trong nền theo lịch được định nghĩa
    • Thiết lập bằng cách kết hợp hướng dẫn và các Skill tùy chọn
    • Khi hoàn tất, kết quả được lưu vào hàng đợi review để có thể tiếp tục xử lý khi cần
  • Ví dụ sử dụng nội bộ tại OpenAI
    • Phân loại issue hằng ngày
    • Tìm và tóm tắt lỗi CI
    • Tạo bản brief phát hành hằng ngày
    • Xác minh bug

Personality: tùy chỉnh phong cách làm việc

  • Mỗi nhà phát triển có sở thích khác nhau trong cách làm việc với agent
    • Có người muốn một đối tác ngắn gọn, tập trung vào thực thi
    • Có người thích tương tác mang tính đối thoại và đồng cảm hơn
  • Codex cho phép chọn giữa hai personality: phong cách ngắn gọn thực dụng và phong cách đối thoại đồng cảm
    • Không thay đổi tính năng, chỉ điều chỉnh theo cách làm việc ưa thích
    • Thiết lập bằng lệnh /personality trong app, CLI và extension IDE

Bảo mật: áp dụng mặc định và có thể cấu hình

  • Bảo mật được tích hợp ngay từ khâu thiết kế trên toàn bộ stack agent của Codex
  • Giống Codex CLI, sử dụng sandbox cấp hệ thống native, mã nguồn mở và có thể cấu hình
  • Thiết lập mặc định
    • Agent chỉ được phép chỉnh sửa file trong thư mục hoặc branch đang làm việc và thực hiện tìm kiếm web đã cache
    • Khi chạy lệnh cần quyền cao hơn như truy cập mạng, sẽ yêu cầu người dùng phê duyệt
  • Có thể cấu hình quy tắc cho dự án hoặc nhóm để một số lệnh nhất định tự động chạy với quyền cao hơn

Khả dụng và giá

  • Ứng dụng Codex có sẵn từ hôm nay trên macOS
  • Người đăng ký ChatGPT Plus, Pro, Business, Enterprise, Edu có thể dùng Codex trên CLI, web, extension IDE và app bằng cách đăng nhập ChatGPT
  • Mức sử dụng được bao gồm trong gói đăng ký ChatGPT, đồng thời có tùy chọn mua thêm credit khi cần
  • Tạm thời, Codex cũng được cung cấp cho người dùng ChatGPT Free và Go
  • Trong giai đoạn này, người dùng Codex hiện có trên mọi gói trả phí được tăng gấp đôi giới hạn sử dụng

Kế hoạch sắp tới

  • Kể từ khi ra mắt GPT-5.2-Codex vào giữa tháng 12/2024, tổng mức sử dụng Codex đã tăng gấp đôi
  • Trong tháng vừa qua, hơn 1 triệu nhà phát triển đã sử dụng Codex
  • Kế hoạch tiếp theo
    • Sẽ phát hành ứng dụng Windows
    • Mở rộng ranh giới khả năng của mô hình
    • Cung cấp suy luận nhanh hơn
  • Các cải tiến trong app
    • Tiếp tục cải thiện workflow đa agent dựa trên phản hồi thực tế
    • Nâng cao khả năng quản lý công việc song song và duy trì ngữ cảnh khi chuyển giữa các agent
  • Mở rộng Automations
    • Đang xây dựng hỗ trợ trigger trên nền tảng đám mây
    • Cho phép Codex tiếp tục chạy trong nền ngay cả khi máy tính không mở

Tiền đề cốt lõi của Codex

  • Dựa trên một tiền đề đơn giản rằng mọi thứ đều được điều khiển bằng mã
  • Agent càng giỏi suy luận và tạo sinh liên quan đến mã thì càng trở nên hiệu quả hơn trong mọi dạng công việc kỹ thuật và tri thức
  • Thách thức cốt lõi hiện nay: khoảng cách giữa khả năng của các mô hình frontier và mức độ mà con người có thể thực sự dễ dàng sử dụng chúng
  • Codex được thiết kế để thu hẹp khoảng cách này bằng cách giúp con người dễ dàng chỉ huy, giám sát và áp dụng toàn bộ trí tuệ của mô hình vào công việc thực tế
  • Tập trung vào việc tạo ra agent lập trình tốt nhất, và đây sẽ là nền tảng cho một agent mạnh mẽ phục vụ phạm vi công việc tri thức rộng lớn vượt ngoài viết mã

8 bình luận

 
xguru 2026-02-03

Dạo này với tôi thì Codex cũng là công cụ chính, khá ổn đấy. Mong bản cho Windows cũng sớm ra mắt.

Lúc mới bắt đầu, nó sẽ tải hết các dự án trước đó bạn từng làm bằng Codex và liệt kê ra bên trái theo từng dự án/thread, nên cực kỳ phù hợp để giao nhiều việc cùng lúc.

 
tested 2026-02-03

Có lý do nào khiến Codex là chính chứ không phải Claude Code không?

 
xguru 2026-02-03

Tôi thường quăng cho nó một tài liệu kế hoạch thật dài rồi bảo cứ thế mà làm, và thấy Codex hợp với kiểu này hơn. Với lại đúng là gần như không bị dính rate limit. Tôi hay chạy đồng thời nhiều project trên một tài khoản rẻ mà vẫn vậy.

 
tested 2026-02-03

Ồ, cảm ơn bình luận của bạn.

Việc tác giả của OpenClaw cũng dùng Codex cũng vậy
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Có vẻ đánh giá về Codex cũng không tệ, nhưng nhìn các bình luận trên Hacker News thì lại có cảm giác không hẳn là vậy...

 
treestae 2026-02-03

Hôm nay tôi thử rồi, quá tuyệt luôn. Các bản fork của VSCode có lẽ phải chuẩn bị tinh thần cho ngày tàn. Tất nhiên, cũng có thể việc làm của các lập trình viên sẽ giảm đi.

 
m00nlygreat 2026-02-03

Có vẻ Windows không có công nghệ sandbox nên khó làm được gì đó.

 
cshj55 2026-02-03

Cho Wsl hay Windows đi...

 
GN⁺ 2026-02-03
Ý kiến trên Hacker News
  • Tôi không hiểu vì sao các công ty AI có hàng tỷ đô la vẫn không làm được ứng dụng native
    Đa số chỉ ở mức UI chat đơn giản, nhưng với Electron thì khó gọi trực tiếp OS API (ví dụ: Win32), nên không thể tích hợp sâu
    Những phần mềm phức tạp như Blender, Godot, Unity, UE5 đều chạy native, nên thật bực khi các công ty kiểu này chỉ toàn viện cớ
    • Môi trường phát triển desktop đang rất lộn xộn. Microsoft tung ra quá nhiều framework nửa vời nên chẳng biết phải dùng gì
      Trên Windows, Electron gần như là tiêu chuẩn thực tế, và ngay cả Microsoft cũng dùng nó thường xuyên
      macOS tốt hơn nhiều, nhưng rồi đội ngũ либо bị khóa vào Mac-only, либо chọn Electron để cross-platform
    • Dạo này UI game cũng dùng HTML/JS khá nhiều
      UI của UE5 cũng gần như không có cảm giác native, và cũng khó mà nói là tốt hơn Electron
      Trong Electron vẫn có thể gọi native API
      Phần lớn người dùng không quan tâm ứng dụng có native hay không, và với doanh nghiệp thì khả năng tái sử dụng web developer sang phát triển ứng dụng desktop là một lợi thế rất lớn
    • Tôi lại nghĩ theo hướng ngược lại. Nếu biến mọi thứ thành giao diện văn bản, mô hình sẽ học công cụ một cách tự nhiên hơn
      TUI hay GUI là các lớp trừu tượng không cần thiết, khiến việc tự động hóa khó hơn
      Cốt lõi là gọi lệnh đơn giản và ghi log. [chế độ headless hoặc session log] gần với hướng đó hơn
    • Thực tế là kết quả làm bằng AI rốt cuộc vẫn là ứng dụng Electron có một ô nhập liệu
    • Tôi không rõ các tính năng mà ứng dụng native có thể cung cấp lại quan trọng đến mức nào
      Phần lớn mọi người không quan tâm ứng dụng được làm bằng web tech hay không
      Nhờ Electron mà port sang Linux cũng dễ hơn. Nếu chỉ khăng khăng native thì điều đó đã không thể xảy ra
  • Tôi đã dùng Codex khá nhiều trong hai tháng gần đây và thấy nó khá ấn tượng
    Nó không hoàn hảo, nhưng liên tục cho ra kết quả ở mức một kỹ sư tầm trung
    Tuy vậy ứng dụng lại bị treo ở “Loading projects…”
    Link tài liệu cũng từng bị hỏng, nhưng liên kết này giờ đã hoạt động
    Tôi đang dùng nhiều môi trường VM qua VS Code Remote, nên có lẽ phải chỉnh lại một chút cấu hình port offset
    • Tôi dùng cả ChatGPT ($20/tháng) lẫn Claude ($200/năm), và Codex thì đến giờ vẫn chưa từng đụng giới hạn sử dụng
      Codex thường bị rơi vào vòng lặp khi giải quyết vấn đề, còn Claude lại xử lý phần kết thúc đó rất tốt
      Luân phiên dùng hai model như vậy khá hiệu quả
    • Tôi đã nhận được phản hồi cảm ơn vì báo lỗi link. Họ nói cũng đang cải thiện tốc độ tải
    • Codex mạnh ở backend hoặc các tác vụ logic, nhưng với công việc UI frontend đơn giản thì hay mắc lỗi
      Dù vậy nó vẫn đang cải thiện đều nên tôi khá kỳ vọng
    • Tôi vẫn sẽ tiếp tục dùng Cursor. OpenAI nên tập trung sửa bug của các ứng dụng hiện có thay vì tung thêm app mới
  • Codex trông giống một sản phẩm cạnh tranh với kiểu Claude Cowork
    Cowork gọi Claude Code trong VM, còn Codex chạy CLI trong sandbox của OS
    Stack kỹ thuật gồm Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, v.v.
    Trên macOS thì dùng Sparkle, Squirrel, Sentry
    • Nhìn vào cái tên và thiết kế xoay quanh diff/worktree thì thấy tính định hướng cho developer rất mạnh
    • Stack kiểu trình độ bootcamp nên hơi thất vọng
    • Tôi tò mò không biết tích hợp Sentry là native hay thông qua MCP
    • Có git và terminal view nên đây là điểm cộng lớn với người dùng CLI. Tôi cũng kỳ vọng vào tính năng skills
  • Tôi đã thử Codex và nó chậm và ngớ ngẩn đến mức phát bực
    Nó không làm theo chỉ thị, dừng giữa chừng, hoặc ném ra đoạn code linh tinh
    Nó thiếu dữ liệu mới liên quan đến Nuxt 4+ nên liên tục sinh lỗi
    Tính năng Undo cũng không hoạt động đúng, và không có phản hồi
    Claude Code xử lý cùng tác vụ đó chỉ trong một lần, còn Codex thì lâu và làm rất tệ
    Điều này khiến tôi nhớ lại thời từng dùng Nokia N800: có tiềm năng, nhưng độ hoàn thiện quá thấp nên khiến tôi lo về định hướng của OpenAI
  • Codex của OpenAI thực chất là một phiên bản chính thức hóa của các sản phẩm như Emdash, Conductor
    Tôi tò mò liệu Anthropic có tung ra một ứng dụng đa tác nhân cho Claude Code tương tự không
    • Đã có Claude Code Desktop rồi
    • Tôi nghĩ cách tiếp cận đa tác nhân đang bị đánh giá quá cao
      Nếu có hợp đồng rõ ràng (ví dụ định nghĩa API), thì chạy song song trong các session độc lập sẽ hiệu quả hơn
    • Khi dùng Claude Code bằng GUI, tôi tò mò không biết nó dùng toàn bộ Claude Code harness hay chỉ dùng model đơn thuần
    • Đây là lần đầu tôi nghe về Emdash, nhưng có quá nhiều công cụ kiểu này nên rất khó quảng bá và thị trường thì quá ồn ào
      Tôi suýt nữa cũng đã tự làm một thứ tương tự
    • Phiên bản web của Claude Code đã được công bố dưới dạng research preview
  • Tôi không thấy hứng thú lắm với các tính năng agent
    Điểm cốt lõi của bài báo Recursive Language Models là quản lý yêu cầu, thiết kế, kế hoạch, v.v. như các đối tượng bất biến thay vì để trong ngữ cảnh
    Tôi quản lý từng giai đoạn (spec, analysis, plan, v.v.) bằng các file .md và vận hành theo quy trình kanban có bước phê duyệt
    Làm vậy thì vẫn chạy tốt ngay cả không cần UI, chất lượng code được giữ ổn định, và về lâu dài tốc độ phát triển nhanh hơn 10 lần
  • Có vẻ tính năng cốt lõi của Codex là chạy agent song song, nhưng tôi đã dùng kiểu đó trong Claude Code suốt 9 tháng nay
    Với .claude/commands.claude/agents, bạn có thể chạy nhiều tác vụ cùng lúc
    Codex bắt được những chỗ Claude bỏ sót, và dùng hai model theo kiểu bổ trợ lẫn nhau thì rất hiệu quả
    Điểm mạnh của Codex là rẻ và mức sử dụng gần như không giới hạn, còn Claude thì chất lượng cao hơn
  • Tôi chủ yếu dùng Claude Code, nhưng orchestrator tốt nhất với tôi lại là Zenflow của Zencoder.ai
    Nó xây dựng quy trình dựa trên plan.md và có thể thêm bước hoặc hook một cách động
    Có thể điều khiển tự động hóa workflow theo kiểu dựa trên tài liệu nên rất tiện
    • Nhưng tìm kiếm một lúc thì lại thường gặp thêm một “ứng dụng bán gói credit AI” khác
      Tôi đã trả tiền cho 3 model lớn rồi nên mấy dịch vụ kiểu này có lẽ khó tồn tại lâu
    • Đã có hơn 500 dịch vụ tích hợp AI tồn tại
  • Ở phía dưới game demo “Voxel Velocity” có ghi “Enter start”, nhưng thực tế Enter chỉ đổi lựa chọn
    Họ nói đã dùng 7 triệu token mà vẫn không bắt được lỗi QA như vậy thì thật đáng ngạc nhiên
    • Bản thân game khá ấn tượng, nhưng ở những chi tiết nhỏ thì kiểm soát chất lượng còn yếu
      Những vấn đề tinh vi kiểu này khó mà bắt được bằng test harness hay QA agent
    • Giữa các phiên bản 60 nghìn, 800 nghìn và 7 triệu token thì gần như không có khác biệt về tính năng game
      Token nhiều hơn chỉ làm độ hoàn thiện cao hơn, còn cách chơi vẫn y hệt. Tôi tò mò số token bổ sung đó thực sự đã làm gì
  • Tôi là người dùng Linux, nên thấy tiếc vì Codex chỉ dành cho Mac
    Tôi cũng tò mò liệu bản CLI có kế hoạch hỗ trợ cùng các tính năng đó không
    • Romain của OpenAI đã trực tiếp trả lời. Vì nó dựa trên Electron nên hỗ trợ Windows và Linux cũng sẽ sớm được bổ sung
    • Hiện tại ngay cả trên Mac thì nó cũng không chạy trên chip Intel
    • macOS phù hợp để thử nghiệm. Cấu hình phần cứng đồng nhất nên ít bug edge case hơn
  • Hơi tiếc vì mọi thứ đều chỉ chạy local
    Sẽ rất tốt nếu có tính năng cluster được quản lý chỉ hoạt động trong mạng nội bộ
    Nếu còn có thể chia sẻ tiến độ công việc với đồng đội thì sẽ là lý tưởng
    • Tôi đang dùng kiểu tương tự với ssh và tmux
      Nếu được hỗ trợ ở cấp độ công cụ thì sẽ tiện hơn rất nhiều
  • OpenAI và Codex từng dẫn dắt đổi mới ban đầu, nhưng giờ Claude và Gemini đang đi trước hơn
    Chất lượng GPT-5.x gần đây cũng giảm, và lần công bố này chỉ phát hành riêng cho Mac nên khá đáng tiếc
    Bài viết cũng có nhiều lỗi chính tả, và tôi không hài lòng vì họ không công bố prompt thực tế đã dùng
    Dù vậy, nếu được cải thiện thì tôi vẫn sẵn sàng thử lại
    • Trong video, đoạn sinh code rõ ràng đã được tăng tốc dựng lên hơn 5x
      Có lẽ vì mọi người đã quen với tốc độ của Sonnet hay Gemini 3.0 Flash
    • Ngược lại, tôi lại thấy Codex ổn định hơn Claude Code hay Gemini trong việc xử lý tác vụ phức tạp
      ChatGPT 20 đô hiệu quả hơn Claude 200 đô
    • OpenAI trước đây cũng từng ưu tiên phát hành macOS trước