- Quản lý nhiều AI agent cùng lúc và hỗ trợ làm việc song song cùng cộng tác dài hạn trong một môi trường phát triển tích hợp cho AI agent
- Mỗi agent chạy trong một luồng độc lập, cho phép đa nhiệm theo từng dự án, review code, bình luận trên diff và chỉnh sửa thủ công
- Thông qua tính năng Skills, phạm vi được mở rộng từ viết mã sang nhiều tác vụ khác như thu thập thông tin, giải quyết vấn đề, tạo hình ảnh, soạn tài liệu và triển khai đám mây
- Với tính năng Automations, có thể tự động thực hiện các tác vụ lặp lại trong nền theo lịch đã định
- Mặc định áp dụng bảo mật sandbox; các lệnh cần quyền cao hơn như truy cập mạng phải được người dùng phê duyệt
- Codex cũng tạm thời được cung cấp cho người dùng ChatGPT Free và Go; các gói trả phí được tăng gấp đôi giới hạn sử dụng
Tổng quan về ứng dụng Codex: trung tâm chỉ huy cho agent
- Kể từ khi Codex ra mắt vào tháng 4/2025, cách các nhà phát triển sử dụng agent đã thay đổi một cách căn bản
- Mô hình giờ đây có thể xử lý các tác vụ phức tạp và dài hạn từ đầu đến cuối
- Các nhà phát triển hiện có thể điều phối nhiều agent trên toàn bộ dự án, giao việc và chạy song song
- Thách thức cốt lõi đã chuyển từ “agent có thể làm gì” sang “con người có thể chỉ huy, giám sát và cộng tác với agent ở quy mô lớn như thế nào”
- IDE hiện có và các công cụ dựa trên terminal không được thiết kế để hỗ trợ cách làm việc này, nên cần công cụ mới
- Ứng dụng Codex cho macOS cho phép quản lý nhiều AI agent đồng thời và thực thi công việc song song
- Hỗ trợ các tác vụ chạy dài hạn, đồng thời quản lý toàn bộ quy trình thiết kế, phát triển, triển khai và bảo trì phần mềm thông qua sự cộng tác giữa các agent
Làm việc song song với nhiều agent
- Ứng dụng Codex cung cấp không gian tập trung cho đa nhiệm với agent
- Agent chạy trong các luồng riêng biệt được cấu hình theo từng dự án, giúp chuyển đổi giữa các công việc mà không mất ngữ cảnh
- Trong luồng, có thể xem lại các thay đổi của agent, thêm bình luận vào diff hoặc chỉnh sửa trực tiếp trong editor
- Hỗ trợ Worktrees mặc định để nhiều agent có thể làm việc trên cùng một repository mà không xung đột
- Mỗi agent làm việc trên một bản sao mã cô lập, cho phép khám phá nhiều hướng khác nhau mà không ảnh hưởng đến trạng thái git cục bộ
- Trong khi agent đang làm việc, có thể checkout thay đổi cục bộ hoặc tiếp tục công việc mà không làm thay đổi trạng thái git cục bộ
- Tự động nhập lịch sử phiên và cài đặt từ Codex CLI và extension IDE, cho phép dùng ngay trong các dự án hiện có
Skills: mở rộng vượt ra ngoài tạo mã
- Codex đang tiến hóa từ một agent viết mã thành một agent thực hiện công việc trên máy tính bằng mã
- Thông qua Skills, có thể mở rộng sang các tác vụ vượt ngoài tạo mã như thu thập và tổng hợp thông tin, giải quyết vấn đề, viết lách
- Có thể đóng gói hướng dẫn, tài nguyên và script để Codex kết nối công cụ và thực thi workflow
- Hoàn thành công việc một cách ổn định theo sở thích của từng nhóm
- Ứng dụng Codex bao gồm giao diện chuyên dụng để tạo và quản lý Skills
- Có thể yêu cầu rõ ràng sử dụng một Skill cụ thể hoặc thiết lập để tự động dùng tùy theo tác vụ
-
Ví dụ sử dụng Skills: tạo game đua xe
- Yêu cầu Codex tạo một game đua xe với nhiều tay đua khác nhau, 8 bản đồ và vật phẩm có thể dùng bằng phím cách
- Sử dụng kỹ năng tạo hình ảnh (dựa trên GPT Image) và kỹ năng phát triển web game
- Hoàn thành trò chơi bằng cách làm việc độc lập với hơn 7 triệu token chỉ từ một prompt ban đầu duy nhất
- Đảm nhiệm vai trò nhà thiết kế, lập trình viên game và QA tester, đồng thời thực sự chơi game để kiểm chứng
- Tên game: Voxel Velocity, game đua kart voxel 3D sử dụng Three.js
- Chế độ đua đơn (luôn 3 vòng, 1 người chơi vs 7 CPU, có sẵn ngay 8 đường đua)
- Mô hình lái arcade, hệ thống drift charge, các mức boost (Tier 1 0.7 giây, Tier 2 1.1 giây, Tier 3 1.5 giây)
- 8 nhân vật, 8 vật phẩm, preset độ khó CPU, triển khai AI spline
-
Các Skills chính được cung cấp
- Implement designs: lấy ngữ cảnh thiết kế, asset và screenshot từ Figma rồi chuyển thành mã UI production có độ tương đồng hình ảnh 1:1
- Manage projects: phân loại bug, theo dõi phát hành và quản lý khối lượng công việc nhóm trong Linear
- Deploy to the cloud: triển khai web app lên các nền tảng cloud host lớn như Cloudflare, Netlify, Render, Vercel
- Generate images: tạo và chỉnh sửa hình ảnh cho website, mockup UI, hình ảnh sản phẩm và asset game bằng kỹ năng tạo ảnh dựa trên GPT Image
- Build with OpenAI APIs: tham chiếu tài liệu mới nhất khi xây dựng bằng OpenAI API
- Create documents: đọc, tạo và chỉnh sửa file PDF, spreadsheet, docx (hỗ trợ định dạng và bố cục chuyên nghiệp)
- Khi tạo Skill mới trong app, có thể dùng ở app, CLI và extension IDE
- Có thể check-in Skill vào repository để chia sẻ cho cả nhóm sử dụng
Automations: tự động hóa tác vụ lặp lại
- Với tính năng Automations, Codex tự động thực hiện công việc trong nền theo lịch được định nghĩa
- Thiết lập bằng cách kết hợp hướng dẫn và các Skill tùy chọn
- Khi hoàn tất, kết quả được lưu vào hàng đợi review để có thể tiếp tục xử lý khi cần
- Ví dụ sử dụng nội bộ tại OpenAI
- Phân loại issue hằng ngày
- Tìm và tóm tắt lỗi CI
- Tạo bản brief phát hành hằng ngày
- Xác minh bug
Personality: tùy chỉnh phong cách làm việc
- Mỗi nhà phát triển có sở thích khác nhau trong cách làm việc với agent
- Có người muốn một đối tác ngắn gọn, tập trung vào thực thi
- Có người thích tương tác mang tính đối thoại và đồng cảm hơn
- Codex cho phép chọn giữa hai personality: phong cách ngắn gọn thực dụng và phong cách đối thoại đồng cảm
- Không thay đổi tính năng, chỉ điều chỉnh theo cách làm việc ưa thích
- Thiết lập bằng lệnh /personality trong app, CLI và extension IDE
Bảo mật: áp dụng mặc định và có thể cấu hình
- Bảo mật được tích hợp ngay từ khâu thiết kế trên toàn bộ stack agent của Codex
- Giống Codex CLI, sử dụng sandbox cấp hệ thống native, mã nguồn mở và có thể cấu hình
- Thiết lập mặc định
- Agent chỉ được phép chỉnh sửa file trong thư mục hoặc branch đang làm việc và thực hiện tìm kiếm web đã cache
- Khi chạy lệnh cần quyền cao hơn như truy cập mạng, sẽ yêu cầu người dùng phê duyệt
- Có thể cấu hình quy tắc cho dự án hoặc nhóm để một số lệnh nhất định tự động chạy với quyền cao hơn
Khả dụng và giá
- Ứng dụng Codex có sẵn từ hôm nay trên macOS
- Người đăng ký ChatGPT Plus, Pro, Business, Enterprise, Edu có thể dùng Codex trên CLI, web, extension IDE và app bằng cách đăng nhập ChatGPT
- Mức sử dụng được bao gồm trong gói đăng ký ChatGPT, đồng thời có tùy chọn mua thêm credit khi cần
- Tạm thời, Codex cũng được cung cấp cho người dùng ChatGPT Free và Go
- Trong giai đoạn này, người dùng Codex hiện có trên mọi gói trả phí được tăng gấp đôi giới hạn sử dụng
Kế hoạch sắp tới
- Kể từ khi ra mắt GPT-5.2-Codex vào giữa tháng 12/2024, tổng mức sử dụng Codex đã tăng gấp đôi
- Trong tháng vừa qua, hơn 1 triệu nhà phát triển đã sử dụng Codex
- Kế hoạch tiếp theo
- Sẽ phát hành ứng dụng Windows
- Mở rộng ranh giới khả năng của mô hình
- Cung cấp suy luận nhanh hơn
- Các cải tiến trong app
- Tiếp tục cải thiện workflow đa agent dựa trên phản hồi thực tế
- Nâng cao khả năng quản lý công việc song song và duy trì ngữ cảnh khi chuyển giữa các agent
- Mở rộng Automations
- Đang xây dựng hỗ trợ trigger trên nền tảng đám mây
- Cho phép Codex tiếp tục chạy trong nền ngay cả khi máy tính không mở
Tiền đề cốt lõi của Codex
- Dựa trên một tiền đề đơn giản rằng mọi thứ đều được điều khiển bằng mã
- Agent càng giỏi suy luận và tạo sinh liên quan đến mã thì càng trở nên hiệu quả hơn trong mọi dạng công việc kỹ thuật và tri thức
- Thách thức cốt lõi hiện nay: khoảng cách giữa khả năng của các mô hình frontier và mức độ mà con người có thể thực sự dễ dàng sử dụng chúng
- Codex được thiết kế để thu hẹp khoảng cách này bằng cách giúp con người dễ dàng chỉ huy, giám sát và áp dụng toàn bộ trí tuệ của mô hình vào công việc thực tế
- Tập trung vào việc tạo ra agent lập trình tốt nhất, và đây sẽ là nền tảng cho một agent mạnh mẽ phục vụ phạm vi công việc tri thức rộng lớn vượt ngoài viết mã
8 bình luận
Dạo này với tôi thì Codex cũng là công cụ chính, khá ổn đấy. Mong bản cho Windows cũng sớm ra mắt.
Lúc mới bắt đầu, nó sẽ tải hết các dự án trước đó bạn từng làm bằng Codex và liệt kê ra bên trái theo từng dự án/thread, nên cực kỳ phù hợp để giao nhiều việc cùng lúc.
Có lý do nào khiến Codex là chính chứ không phải Claude Code không?
Tôi thường quăng cho nó một tài liệu kế hoạch thật dài rồi bảo cứ thế mà làm, và thấy Codex hợp với kiểu này hơn. Với lại đúng là gần như không bị dính rate limit. Tôi hay chạy đồng thời nhiều project trên một tài khoản rẻ mà vẫn vậy.
Ồ, cảm ơn bình luận của bạn.
Việc tác giả của OpenClaw cũng dùng Codex cũng vậy
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”
Có vẻ đánh giá về Codex cũng không tệ, nhưng nhìn các bình luận trên Hacker News thì lại có cảm giác không hẳn là vậy...
Hôm nay tôi thử rồi, quá tuyệt luôn. Các bản fork của VSCode có lẽ phải chuẩn bị tinh thần cho ngày tàn. Tất nhiên, cũng có thể việc làm của các lập trình viên sẽ giảm đi.
Có vẻ Windows không có công nghệ sandbox nên khó làm được gì đó.
Cho Wsl hay Windows đi...
Ý kiến trên Hacker News
Đa số chỉ ở mức UI chat đơn giản, nhưng với Electron thì khó gọi trực tiếp OS API (ví dụ: Win32), nên không thể tích hợp sâu
Những phần mềm phức tạp như Blender, Godot, Unity, UE5 đều chạy native, nên thật bực khi các công ty kiểu này chỉ toàn viện cớ
Trên Windows, Electron gần như là tiêu chuẩn thực tế, và ngay cả Microsoft cũng dùng nó thường xuyên
macOS tốt hơn nhiều, nhưng rồi đội ngũ либо bị khóa vào Mac-only, либо chọn Electron để cross-platform
UI của UE5 cũng gần như không có cảm giác native, và cũng khó mà nói là tốt hơn Electron
Trong Electron vẫn có thể gọi native API
Phần lớn người dùng không quan tâm ứng dụng có native hay không, và với doanh nghiệp thì khả năng tái sử dụng web developer sang phát triển ứng dụng desktop là một lợi thế rất lớn
TUI hay GUI là các lớp trừu tượng không cần thiết, khiến việc tự động hóa khó hơn
Cốt lõi là gọi lệnh đơn giản và ghi log. [chế độ headless hoặc session log] gần với hướng đó hơn
Phần lớn mọi người không quan tâm ứng dụng được làm bằng web tech hay không
Nhờ Electron mà port sang Linux cũng dễ hơn. Nếu chỉ khăng khăng native thì điều đó đã không thể xảy ra
Nó không hoàn hảo, nhưng liên tục cho ra kết quả ở mức một kỹ sư tầm trung
Tuy vậy ứng dụng lại bị treo ở “Loading projects…”
Link tài liệu cũng từng bị hỏng, nhưng liên kết này giờ đã hoạt động
Tôi đang dùng nhiều môi trường VM qua VS Code Remote, nên có lẽ phải chỉnh lại một chút cấu hình port offset
Codex thường bị rơi vào vòng lặp khi giải quyết vấn đề, còn Claude lại xử lý phần kết thúc đó rất tốt
Luân phiên dùng hai model như vậy khá hiệu quả
Dù vậy nó vẫn đang cải thiện đều nên tôi khá kỳ vọng
Cowork gọi Claude Code trong VM, còn Codex chạy CLI trong sandbox của OS
Stack kỹ thuật gồm Electron 40, React 19, TypeScript, Node.js, SQLite, Vite, v.v.
Trên macOS thì dùng Sparkle, Squirrel, Sentry
Nó không làm theo chỉ thị, dừng giữa chừng, hoặc ném ra đoạn code linh tinh
Nó thiếu dữ liệu mới liên quan đến Nuxt 4+ nên liên tục sinh lỗi
Tính năng Undo cũng không hoạt động đúng, và không có phản hồi
Claude Code xử lý cùng tác vụ đó chỉ trong một lần, còn Codex thì lâu và làm rất tệ
Điều này khiến tôi nhớ lại thời từng dùng Nokia N800: có tiềm năng, nhưng độ hoàn thiện quá thấp nên khiến tôi lo về định hướng của OpenAI
Tôi tò mò liệu Anthropic có tung ra một ứng dụng đa tác nhân cho Claude Code tương tự không
Nếu có hợp đồng rõ ràng (ví dụ định nghĩa API), thì chạy song song trong các session độc lập sẽ hiệu quả hơn
Tôi suýt nữa cũng đã tự làm một thứ tương tự
Điểm cốt lõi của bài báo Recursive Language Models là quản lý yêu cầu, thiết kế, kế hoạch, v.v. như các đối tượng bất biến thay vì để trong ngữ cảnh
Tôi quản lý từng giai đoạn (spec, analysis, plan, v.v.) bằng các file .md và vận hành theo quy trình kanban có bước phê duyệt
Làm vậy thì vẫn chạy tốt ngay cả không cần UI, chất lượng code được giữ ổn định, và về lâu dài tốc độ phát triển nhanh hơn 10 lần
Với
.claude/commandsvà.claude/agents, bạn có thể chạy nhiều tác vụ cùng lúcCodex bắt được những chỗ Claude bỏ sót, và dùng hai model theo kiểu bổ trợ lẫn nhau thì rất hiệu quả
Điểm mạnh của Codex là rẻ và mức sử dụng gần như không giới hạn, còn Claude thì chất lượng cao hơn
Nó xây dựng quy trình dựa trên plan.md và có thể thêm bước hoặc hook một cách động
Có thể điều khiển tự động hóa workflow theo kiểu dựa trên tài liệu nên rất tiện
Tôi đã trả tiền cho 3 model lớn rồi nên mấy dịch vụ kiểu này có lẽ khó tồn tại lâu
Họ nói đã dùng 7 triệu token mà vẫn không bắt được lỗi QA như vậy thì thật đáng ngạc nhiên
Những vấn đề tinh vi kiểu này khó mà bắt được bằng test harness hay QA agent
Token nhiều hơn chỉ làm độ hoàn thiện cao hơn, còn cách chơi vẫn y hệt. Tôi tò mò số token bổ sung đó thực sự đã làm gì
Tôi cũng tò mò liệu bản CLI có kế hoạch hỗ trợ cùng các tính năng đó không
Sẽ rất tốt nếu có tính năng cluster được quản lý chỉ hoạt động trong mạng nội bộ
Nếu còn có thể chia sẻ tiến độ công việc với đồng đội thì sẽ là lý tưởng
Nếu được hỗ trợ ở cấp độ công cụ thì sẽ tiện hơn rất nhiều
Chất lượng GPT-5.x gần đây cũng giảm, và lần công bố này chỉ phát hành riêng cho Mac nên khá đáng tiếc
Bài viết cũng có nhiều lỗi chính tả, và tôi không hài lòng vì họ không công bố prompt thực tế đã dùng
Dù vậy, nếu được cải thiện thì tôi vẫn sẵn sàng thử lại
Có lẽ vì mọi người đã quen với tốc độ của Sonnet hay Gemini 3.0 Flash
ChatGPT 20 đô hiệu quả hơn Claude 200 đô