OpenAI ra mắt ứng dụng Codex cho macOS

(openai.com)

12 điểm bởi GN⁺ 2026-02-03 | 8 bình luận | Chia sẻ qua WhatsApp

Quản lý nhiều AI agent cùng lúc và hỗ trợ làm việc song song cùng cộng tác dài hạn trong một môi trường phát triển tích hợp cho AI agent
Mỗi agent chạy trong một luồng độc lập, cho phép đa nhiệm theo từng dự án, review code, bình luận trên diff và chỉnh sửa thủ công
Thông qua tính năng Skills, phạm vi được mở rộng từ viết mã sang nhiều tác vụ khác như thu thập thông tin, giải quyết vấn đề, tạo hình ảnh, soạn tài liệu và triển khai đám mây
Với tính năng Automations, có thể tự động thực hiện các tác vụ lặp lại trong nền theo lịch đã định
Mặc định áp dụng bảo mật sandbox; các lệnh cần quyền cao hơn như truy cập mạng phải được người dùng phê duyệt
Codex cũng tạm thời được cung cấp cho người dùng ChatGPT Free và Go; các gói trả phí được tăng gấp đôi giới hạn sử dụng

Tổng quan về ứng dụng Codex: trung tâm chỉ huy cho agent

Kể từ khi Codex ra mắt vào tháng 4/2025, cách các nhà phát triển sử dụng agent đã thay đổi một cách căn bản
- Mô hình giờ đây có thể xử lý các tác vụ phức tạp và dài hạn từ đầu đến cuối
- Các nhà phát triển hiện có thể điều phối nhiều agent trên toàn bộ dự án, giao việc và chạy song song
Thách thức cốt lõi đã chuyển từ “agent có thể làm gì” sang “con người có thể chỉ huy, giám sát và cộng tác với agent ở quy mô lớn như thế nào”
IDE hiện có và các công cụ dựa trên terminal không được thiết kế để hỗ trợ cách làm việc này, nên cần công cụ mới
Ứng dụng Codex cho macOS cho phép quản lý nhiều AI agent đồng thời và thực thi công việc song song
Hỗ trợ các tác vụ chạy dài hạn, đồng thời quản lý toàn bộ quy trình thiết kế, phát triển, triển khai và bảo trì phần mềm thông qua sự cộng tác giữa các agent

Làm việc song song với nhiều agent

Ứng dụng Codex cung cấp không gian tập trung cho đa nhiệm với agent
- Agent chạy trong các luồng riêng biệt được cấu hình theo từng dự án, giúp chuyển đổi giữa các công việc mà không mất ngữ cảnh
- Trong luồng, có thể xem lại các thay đổi của agent, thêm bình luận vào diff hoặc chỉnh sửa trực tiếp trong editor
Hỗ trợ Worktrees mặc định để nhiều agent có thể làm việc trên cùng một repository mà không xung đột
- Mỗi agent làm việc trên một bản sao mã cô lập, cho phép khám phá nhiều hướng khác nhau mà không ảnh hưởng đến trạng thái git cục bộ
- Trong khi agent đang làm việc, có thể checkout thay đổi cục bộ hoặc tiếp tục công việc mà không làm thay đổi trạng thái git cục bộ
Tự động nhập lịch sử phiên và cài đặt từ Codex CLI và extension IDE, cho phép dùng ngay trong các dự án hiện có

Skills: mở rộng vượt ra ngoài tạo mã

Codex đang tiến hóa từ một agent viết mã thành một agent thực hiện công việc trên máy tính bằng mã
Thông qua Skills, có thể mở rộng sang các tác vụ vượt ngoài tạo mã như thu thập và tổng hợp thông tin, giải quyết vấn đề, viết lách
- Có thể đóng gói hướng dẫn, tài nguyên và script để Codex kết nối công cụ và thực thi workflow
- Hoàn thành công việc một cách ổn định theo sở thích của từng nhóm
Quảng cáo
Ứng dụng Codex bao gồm giao diện chuyên dụng để tạo và quản lý Skills
- Có thể yêu cầu rõ ràng sử dụng một Skill cụ thể hoặc thiết lập để tự động dùng tùy theo tác vụ
Ví dụ sử dụng Skills: tạo game đua xe
- Yêu cầu Codex tạo một game đua xe với nhiều tay đua khác nhau, 8 bản đồ và vật phẩm có thể dùng bằng phím cách
  - Sử dụng kỹ năng tạo hình ảnh (dựa trên GPT Image) và kỹ năng phát triển web game
  - Hoàn thành trò chơi bằng cách làm việc độc lập với hơn 7 triệu token chỉ từ một prompt ban đầu duy nhất
  - Đảm nhiệm vai trò nhà thiết kế, lập trình viên game và QA tester, đồng thời thực sự chơi game để kiểm chứng
- Tên game: Voxel Velocity, game đua kart voxel 3D sử dụng Three.js
  - Chế độ đua đơn (luôn 3 vòng, 1 người chơi vs 7 CPU, có sẵn ngay 8 đường đua)
  - Mô hình lái arcade, hệ thống drift charge, các mức boost (Tier 1 0.7 giây, Tier 2 1.1 giây, Tier 3 1.5 giây)
  - 8 nhân vật, 8 vật phẩm, preset độ khó CPU, triển khai AI spline
Các Skills chính được cung cấp
- Implement designs: lấy ngữ cảnh thiết kế, asset và screenshot từ Figma rồi chuyển thành mã UI production có độ tương đồng hình ảnh 1:1
- Manage projects: phân loại bug, theo dõi phát hành và quản lý khối lượng công việc nhóm trong Linear
- Deploy to the cloud: triển khai web app lên các nền tảng cloud host lớn như Cloudflare, Netlify, Render, Vercel
- Generate images: tạo và chỉnh sửa hình ảnh cho website, mockup UI, hình ảnh sản phẩm và asset game bằng kỹ năng tạo ảnh dựa trên GPT Image
- Build with OpenAI APIs: tham chiếu tài liệu mới nhất khi xây dựng bằng OpenAI API
- Create documents: đọc, tạo và chỉnh sửa file PDF, spreadsheet, docx (hỗ trợ định dạng và bố cục chuyên nghiệp)
- Khi tạo Skill mới trong app, có thể dùng ở app, CLI và extension IDE
- Có thể check-in Skill vào repository để chia sẻ cho cả nhóm sử dụng

Automations: tự động hóa tác vụ lặp lại

Với tính năng Automations, Codex tự động thực hiện công việc trong nền theo lịch được định nghĩa
- Thiết lập bằng cách kết hợp hướng dẫn và các Skill tùy chọn
- Khi hoàn tất, kết quả được lưu vào hàng đợi review để có thể tiếp tục xử lý khi cần
Quảng cáo
Ví dụ sử dụng nội bộ tại OpenAI
- Phân loại issue hằng ngày
- Tìm và tóm tắt lỗi CI
- Tạo bản brief phát hành hằng ngày
- Xác minh bug

Personality: tùy chỉnh phong cách làm việc

Mỗi nhà phát triển có sở thích khác nhau trong cách làm việc với agent
- Có người muốn một đối tác ngắn gọn, tập trung vào thực thi
- Có người thích tương tác mang tính đối thoại và đồng cảm hơn
Codex cho phép chọn giữa hai personality: phong cách ngắn gọn thực dụng và phong cách đối thoại đồng cảm
- Không thay đổi tính năng, chỉ điều chỉnh theo cách làm việc ưa thích
- Thiết lập bằng lệnh /personality trong app, CLI và extension IDE

Bảo mật: áp dụng mặc định và có thể cấu hình

Bảo mật được tích hợp ngay từ khâu thiết kế trên toàn bộ stack agent của Codex
Giống Codex CLI, sử dụng sandbox cấp hệ thống native, mã nguồn mở và có thể cấu hình
Thiết lập mặc định
- Agent chỉ được phép chỉnh sửa file trong thư mục hoặc branch đang làm việc và thực hiện tìm kiếm web đã cache
- Khi chạy lệnh cần quyền cao hơn như truy cập mạng, sẽ yêu cầu người dùng phê duyệt
Quảng cáo
Có thể cấu hình quy tắc cho dự án hoặc nhóm để một số lệnh nhất định tự động chạy với quyền cao hơn

Khả dụng và giá

Ứng dụng Codex có sẵn từ hôm nay trên macOS
Người đăng ký ChatGPT Plus, Pro, Business, Enterprise, Edu có thể dùng Codex trên CLI, web, extension IDE và app bằng cách đăng nhập ChatGPT
Mức sử dụng được bao gồm trong gói đăng ký ChatGPT, đồng thời có tùy chọn mua thêm credit khi cần
Tạm thời, Codex cũng được cung cấp cho người dùng ChatGPT Free và Go
Trong giai đoạn này, người dùng Codex hiện có trên mọi gói trả phí được tăng gấp đôi giới hạn sử dụng

Kế hoạch sắp tới

Kể từ khi ra mắt GPT-5.2-Codex vào giữa tháng 12/2024, tổng mức sử dụng Codex đã tăng gấp đôi
Trong tháng vừa qua, hơn 1 triệu nhà phát triển đã sử dụng Codex
Kế hoạch tiếp theo
- Sẽ phát hành ứng dụng Windows
- Mở rộng ranh giới khả năng của mô hình
- Cung cấp suy luận nhanh hơn
Các cải tiến trong app
- Tiếp tục cải thiện workflow đa agent dựa trên phản hồi thực tế
- Nâng cao khả năng quản lý công việc song song và duy trì ngữ cảnh khi chuyển giữa các agent
Mở rộng Automations
- Đang xây dựng hỗ trợ trigger trên nền tảng đám mây
- Cho phép Codex tiếp tục chạy trong nền ngay cả khi máy tính không mở

Tiền đề cốt lõi của Codex

Dựa trên một tiền đề đơn giản rằng mọi thứ đều được điều khiển bằng mã
Agent càng giỏi suy luận và tạo sinh liên quan đến mã thì càng trở nên hiệu quả hơn trong mọi dạng công việc kỹ thuật và tri thức
Thách thức cốt lõi hiện nay: khoảng cách giữa khả năng của các mô hình frontier và mức độ mà con người có thể thực sự dễ dàng sử dụng chúng
Codex được thiết kế để thu hẹp khoảng cách này bằng cách giúp con người dễ dàng chỉ huy, giám sát và áp dụng toàn bộ trí tuệ của mô hình vào công việc thực tế
Tập trung vào việc tạo ra agent lập trình tốt nhất, và đây sẽ là nền tảng cho một agent mạnh mẽ phục vụ phạm vi công việc tri thức rộng lớn vượt ngoài viết mã

8 bình luận

treestae 2026-02-03

Hôm nay tôi thử rồi, quá tuyệt luôn. Các bản fork của VSCode có lẽ phải chuẩn bị tinh thần cho ngày tàn. Tất nhiên, cũng có thể việc làm của các lập trình viên sẽ giảm đi.

m00nlygreat 2026-02-03

Có vẻ Windows không có công nghệ sandbox nên khó làm được gì đó.

cshj55 2026-02-03

Cho Wsl hay Windows đi...

xguru 2026-02-03

Dạo này với tôi thì Codex cũng là công cụ chính, khá ổn đấy. Mong bản cho Windows cũng sớm ra mắt.

Lúc mới bắt đầu, nó sẽ tải hết các dự án trước đó bạn từng làm bằng Codex và liệt kê ra bên trái theo từng dự án/thread, nên cực kỳ phù hợp để giao nhiều việc cùng lúc.

tested 2026-02-03

Có lý do nào khiến Codex là chính chứ không phải Claude Code không?

xguru 2026-02-03

Tôi thường quăng cho nó một tài liệu kế hoạch thật dài rồi bảo cứ thế mà làm, và thấy Codex hợp với kiểu này hơn. Với lại đúng là gần như không bị dính rate limit. Tôi hay chạy đồng thời nhiều project trên một tài khoản rẻ mà vẫn vậy.

tested 2026-02-03

Ồ, cảm ơn bình luận của bạn.

Việc tác giả của OpenClaw cũng dùng Codex cũng vậy

MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Có vẻ đánh giá về Codex cũng không tệ, nhưng nhìn các bình luận trên Hacker News thì lại có cảm giác không hẳn là vậy...

GN⁺ 2026-02-03

Ý kiến trên Hacker News

Tôi không hiểu vì sao các công ty AI có hàng tỷ đô la vẫn không làm được ứng dụng native
Đa số chỉ ở mức UI chat đơn giản, nhưng với Electron thì khó gọi trực tiếp OS API (ví dụ: Win32), nên không thể tích hợp sâu
Những phần mềm phức tạp như Blender, Godot, Unity, UE5 đều chạy native, nên thật bực khi các công ty kiểu này chỉ toàn viện cớ
- Môi trường phát triển desktop đang rất lộn xộn. Microsoft tung ra quá nhiều framework nửa vời nên chẳng biết phải dùng gì
  Trên Windows, Electron gần như là tiêu chuẩn thực tế, và ngay cả Microsoft cũng dùng nó thường xuyên
  macOS tốt hơn nhiều, nhưng rồi đội ngũ либо bị khóa vào Mac-only, либо chọn Electron để cross-platform
- Dạo này UI game cũng dùng HTML/JS khá nhiều
  UI của UE5 cũng gần như không có cảm giác native, và cũng khó mà nói là tốt hơn Electron
  Trong Electron vẫn có thể gọi native API
  Phần lớn người dùng không quan tâm ứng dụng có native hay không, và với doanh nghiệp thì khả năng tái sử dụng web developer sang phát triển ứng dụng desktop là một lợi thế rất lớn
- Tôi lại nghĩ theo hướng ngược lại. Nếu biến mọi thứ thành giao diện văn bản, mô hình sẽ học công cụ một cách tự nhiên hơn
  TUI hay GUI là các lớp trừu tượng không cần thiết, khiến việc tự động hóa khó hơn
  Cốt lõi là gọi lệnh đơn giản và ghi log. [chế độ headless hoặc session log] gần với hướng đó hơn
- Thực tế là kết quả làm bằng AI rốt cuộc vẫn là ứng dụng Electron có một ô nhập liệu
- Tôi không rõ các tính năng mà ứng dụng native có thể cung cấp lại quan trọng đến mức nào
  Phần lớn mọi người không quan tâm ứng dụng được làm bằng web tech hay không
  Nhờ Electron mà port sang Linux cũng dễ hơn. Nếu chỉ khăng khăng native thì điều đó đã không thể xảy ra
Tôi đã dùng Codex khá nhiều trong hai tháng gần đây và thấy nó khá ấn tượng
Nó không hoàn hảo, nhưng liên tục cho ra kết quả ở mức một kỹ sư tầm trung
Tuy vậy ứng dụng lại bị treo ở “Loading projects…”
Link tài liệu cũng từng bị hỏng, nhưng liên kết này giờ đã hoạt động
Tôi đang dùng nhiều môi trường VM qua VS Code Remote, nên có lẽ phải chỉnh lại một chút cấu hình port offset
- Tôi dùng cả ChatGPT ($20/tháng) lẫn Claude ($200/năm), và Codex thì đến giờ vẫn chưa từng đụng giới hạn sử dụng
  Codex thường bị rơi vào vòng lặp khi giải quyết vấn đề, còn Claude lại xử lý phần kết thúc đó rất tốt
  Luân phiên dùng hai model như vậy khá hiệu quả
- Tôi đã nhận được phản hồi cảm ơn vì báo lỗi link. Họ nói cũng đang cải thiện tốc độ tải
- Codex mạnh ở backend hoặc các tác vụ logic, nhưng với công việc UI frontend đơn giản thì hay mắc lỗi
  Dù vậy nó vẫn đang cải thiện đều nên tôi khá kỳ vọng
- Tôi vẫn sẽ tiếp tục dùng Cursor. OpenAI nên tập trung sửa bug của các ứng dụng hiện có thay vì tung thêm app mới
Codex trông giống một sản phẩm cạnh tranh với kiểu Claude Cowork
Cowork gọi Claude Code trong VM, còn Codex chạy CLI trong sandbox của OS
Stack kỹ thuật gồm Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, v.v.
Trên macOS thì dùng Sparkle, Squirrel, Sentry
- Nhìn vào cái tên và thiết kế xoay quanh diff/worktree thì thấy tính định hướng cho developer rất mạnh
- Stack kiểu trình độ bootcamp nên hơi thất vọng
- Tôi tò mò không biết tích hợp Sentry là native hay thông qua MCP
- Có git và terminal view nên đây là điểm cộng lớn với người dùng CLI. Tôi cũng kỳ vọng vào tính năng skills
Tôi đã thử Codex và nó chậm và ngớ ngẩn đến mức phát bực
Nó không làm theo chỉ thị, dừng giữa chừng, hoặc ném ra đoạn code linh tinh
Nó thiếu dữ liệu mới liên quan đến Nuxt 4+ nên liên tục sinh lỗi
Tính năng Undo cũng không hoạt động đúng, và không có phản hồi
Claude Code xử lý cùng tác vụ đó chỉ trong một lần, còn Codex thì lâu và làm rất tệ
Điều này khiến tôi nhớ lại thời từng dùng Nokia N800: có tiềm năng, nhưng độ hoàn thiện quá thấp nên khiến tôi lo về định hướng của OpenAI
Codex của OpenAI thực chất là một phiên bản chính thức hóa của các sản phẩm như Emdash, Conductor
Tôi tò mò liệu Anthropic có tung ra một ứng dụng đa tác nhân cho Claude Code tương tự không
- Đã có Claude Code Desktop rồi
- Tôi nghĩ cách tiếp cận đa tác nhân đang bị đánh giá quá cao
  Nếu có hợp đồng rõ ràng (ví dụ định nghĩa API), thì chạy song song trong các session độc lập sẽ hiệu quả hơn
- Khi dùng Claude Code bằng GUI, tôi tò mò không biết nó dùng toàn bộ Claude Code harness hay chỉ dùng model đơn thuần
- Đây là lần đầu tôi nghe về Emdash, nhưng có quá nhiều công cụ kiểu này nên rất khó quảng bá và thị trường thì quá ồn ào
  Tôi suýt nữa cũng đã tự làm một thứ tương tự
- Phiên bản web của Claude Code đã được công bố dưới dạng research preview
Tôi không thấy hứng thú lắm với các tính năng agent
Điểm cốt lõi của bài báo Recursive Language Models là quản lý yêu cầu, thiết kế, kế hoạch, v.v. như các đối tượng bất biến thay vì để trong ngữ cảnh
Tôi quản lý từng giai đoạn (spec, analysis, plan, v.v.) bằng các file .md và vận hành theo quy trình kanban có bước phê duyệt
Làm vậy thì vẫn chạy tốt ngay cả không cần UI, chất lượng code được giữ ổn định, và về lâu dài tốc độ phát triển nhanh hơn 10 lần
Có vẻ tính năng cốt lõi của Codex là chạy agent song song, nhưng tôi đã dùng kiểu đó trong Claude Code suốt 9 tháng nay
Với .claude/commands và .claude/agents, bạn có thể chạy nhiều tác vụ cùng lúc
Codex bắt được những chỗ Claude bỏ sót, và dùng hai model theo kiểu bổ trợ lẫn nhau thì rất hiệu quả
Điểm mạnh của Codex là rẻ và mức sử dụng gần như không giới hạn, còn Claude thì chất lượng cao hơn
Tôi chủ yếu dùng Claude Code, nhưng orchestrator tốt nhất với tôi lại là Zenflow của Zencoder.ai
Nó xây dựng quy trình dựa trên plan.md và có thể thêm bước hoặc hook một cách động
Có thể điều khiển tự động hóa workflow theo kiểu dựa trên tài liệu nên rất tiện
- Nhưng tìm kiếm một lúc thì lại thường gặp thêm một “ứng dụng bán gói credit AI” khác
  Tôi đã trả tiền cho 3 model lớn rồi nên mấy dịch vụ kiểu này có lẽ khó tồn tại lâu
- Đã có hơn 500 dịch vụ tích hợp AI tồn tại
Ở phía dưới game demo “Voxel Velocity” có ghi “Enter start”, nhưng thực tế Enter chỉ đổi lựa chọn
Họ nói đã dùng 7 triệu token mà vẫn không bắt được lỗi QA như vậy thì thật đáng ngạc nhiên
- Bản thân game khá ấn tượng, nhưng ở những chi tiết nhỏ thì kiểm soát chất lượng còn yếu
  Những vấn đề tinh vi kiểu này khó mà bắt được bằng test harness hay QA agent
- Giữa các phiên bản 60 nghìn, 800 nghìn và 7 triệu token thì gần như không có khác biệt về tính năng game
  Token nhiều hơn chỉ làm độ hoàn thiện cao hơn, còn cách chơi vẫn y hệt. Tôi tò mò số token bổ sung đó thực sự đã làm gì
Tôi là người dùng Linux, nên thấy tiếc vì Codex chỉ dành cho Mac
Tôi cũng tò mò liệu bản CLI có kế hoạch hỗ trợ cùng các tính năng đó không
- Romain của OpenAI đã trực tiếp trả lời. Vì nó dựa trên Electron nên hỗ trợ Windows và Linux cũng sẽ sớm được bổ sung
- Hiện tại ngay cả trên Mac thì nó cũng không chạy trên chip Intel
- macOS phù hợp để thử nghiệm. Cấu hình phần cứng đồng nhất nên ít bug edge case hơn
Hơi tiếc vì mọi thứ đều chỉ chạy local
Sẽ rất tốt nếu có tính năng cluster được quản lý chỉ hoạt động trong mạng nội bộ
Nếu còn có thể chia sẻ tiến độ công việc với đồng đội thì sẽ là lý tưởng
- Tôi đang dùng kiểu tương tự với ssh và tmux
  Nếu được hỗ trợ ở cấp độ công cụ thì sẽ tiện hơn rất nhiều
OpenAI và Codex từng dẫn dắt đổi mới ban đầu, nhưng giờ Claude và Gemini đang đi trước hơn
Chất lượng GPT-5.x gần đây cũng giảm, và lần công bố này chỉ phát hành riêng cho Mac nên khá đáng tiếc
Bài viết cũng có nhiều lỗi chính tả, và tôi không hài lòng vì họ không công bố prompt thực tế đã dùng
Dù vậy, nếu được cải thiện thì tôi vẫn sẵn sàng thử lại
- Trong video, đoạn sinh code rõ ràng đã được tăng tốc dựng lên hơn 5x
  Có lẽ vì mọi người đã quen với tốc độ của Sonnet hay Gemini 3.0 Flash
- Ngược lại, tôi lại thấy Codex ổn định hơn Claude Code hay Gemini trong việc xử lý tác vụ phức tạp
  ChatGPT 20 đô hiệu quả hơn Claude 200 đô
- OpenAI trước đây cũng từng ưu tiên phát hành macOS trước