- Video webinar bài giảng về Codex dành cho nhà phát triển do chính OpenAI công bố (58 phút)
- Codex là một nền tảng tác nhân lập trình được thiết kế để kỹ sư có thể ủy quyền các tác vụ quy mô lớn cho tác nhân, vượt xa việc hoàn thành mã hay pair programming
- Chia sẻ cùng một backend trên nhiều giao diện như ứng dụng Codex, CLI, tiện ích mở rộng IDE, và có thể chạy song song nhiều tác vụ cùng lúc
- Bao phủ toàn bộ vòng đời phát triển phần mềm (SDLC) từ lập kế hoạch (Plan), thiết kế (Design), xây dựng (Build), kiểm thử (Test), review (Review), tài liệu hóa (Document) đến triển khai và bảo trì (Deploy & Maintenance)
- Thông qua tệp agents.md, có thể thiết lập chỉ dẫn hành vi của tác nhân theo từng repository, đồng thời đóng gói các workflow lặp lại bằng Skills và Automations để chạy tự động
- Hỗ trợ làm việc liên tục trong 25 giờ và duy trì ngữ cảnh dài thông qua 13~14 lần compaction phía máy chủ, đồng thời bảo đảm an toàn bằng sandbox ở cấp hệ điều hành
Sự tiến hóa của AI coding: từ hoàn thành mã đến ủy quyền cho tác nhân
- Trong vài năm qua, AI coding đã phát triển qua các giai đoạn hoàn thành mã (tăng tốc độ gõ khoảng 10%) → pair programming (lập kế hoạch giữa các tệp, chạy kiểm thử, sửa repository)
- Cả hai cách tiếp cận đều tập trung vào việc tạo ra một "cộng tác viên tốt hơn", nhưng Codex bắt đầu được phát triển từ một năm trước với mục tiêu xây dựng tác nhân có thể được ủy quyền
- Tháng 12 năm 2025, mô hình GT 5.2 Codex đạt được khả năng làm việc liên tục trong thời gian dài và mức độ điều khiển cao (steerability), qua đó giải quyết rào cản cốt lõi của "ủy quyền tác nhân thực sự"
- Sau đó, hiệu năng tiếp tục được cải thiện với GT 5.3 nhanh và hiệu quả hơn, cùng mô hình mới nhất GT 5.4
- Điểm tiến bộ then chốt là khả năng điều hướng ổn định trong các codebase doanh nghiệp quy mô lớn và duy trì trạng thái căn chỉnh lâu dài theo đúng ý định của người dùng
Các giao diện có thể sử dụng Codex
- Codex cho phép dùng một tác nhân trên nhiều bề mặt (surface) như CLI, tiện ích mở rộng IDE, ứng dụng Codex, và tất cả đều dùng chung cùng backend
- Ứng dụng Codex là giao diện trực quan nhất cho việc chạy tác vụ song song, được tối ưu để vận hành nhiều tác nhân cùng lúc và rà soát đầu ra
- Trường hợp của Peter Steinberger (nhà sáng lập OpenClaw): chuyển từ cách quản lý hơn 10 cửa sổ CLI sang ứng dụng Codex, từ đó nâng cao hiệu quả quản lý tác nhân song song
- Hỗ trợ cả macOS và Windows, có thể tải tại openai.com/codex, bản Windows cũng có trên Microsoft Store
- Trên CLI, đăng nhập ban đầu bằng lệnh
codex login, sau đó bắt đầu phiên bằng lệnh codex
UI và thiết lập của ứng dụng Codex
- Có thể chọn mô hình (GPT 5.4, v.v.) và điều chỉnh mức nỗ lực suy luận (reasoning effort): low, medium, high, extra high
medium là mặc định, cân bằng tốt nhất giữa tốc độ và độ sâu suy luận
- Với câu hỏi đơn giản nên dùng
low, còn khi cần suy nghĩ sâu trong thời gian dài thì high hoặc extra high phù hợp hơn
- Có thể điều chỉnh tốc độ phản hồi bằng công tắc Speed mode (fast/standard)
- Ngoài làm việc cục bộ còn có chế độ Git worktree và tùy chọn khởi chạy cloud container từ xa
- Thiết lập quyền hạn: có thể chọn giữa quyền mặc định (đọc/chỉnh sửa tệp trong dự án, yêu cầu phê duyệt với lệnh nguy hiểm) và quyền truy cập toàn phần (toàn bộ tệp trên máy, truy cập mạng, chạy không cần phê duyệt)
- Người dùng mới được khuyến nghị dùng quyền mặc định
- Có thể thêm và chuyển đổi dự án (thư mục) từ thanh bên trái
Ứng dụng Codex ở mọi giai đoạn của SDLC
- OpenAI đã phát hành tài liệu "Building an AI Native Engineering Team", tổng hợp cách các tác nhân lập trình tăng tốc toàn bộ 7 giai đoạn của SDLC (lập kế hoạch, thiết kế, xây dựng, kiểm thử, review, tài liệu hóa, triển khai/bảo trì)
- Đặc biệt, giai đoạn kiểm thử và review ngày càng quan trọng hơn khi năng lực sinh mã được cải thiện
- Codex được đánh giá đặc biệt nổi bật trong suy luận trên codebase phức tạp và viết mã đạt mức production
Giai đoạn lập kế hoạch (Plan)
- Bật Plan mode bằng
/plan hoặc Shift+Tab để Codex lập kế hoạch trước khi triển khai
- Trong demo, khi được yêu cầu lập kế hoạch cho một ứng dụng companion iOS bằng SwiftUI, Codex đã khám phá codebase rồi đưa ra các câu hỏi tiếp theo (phương thức xác thực, phạm vi bản phát hành đầu tiên, v.v.)
- Có thể điều chỉnh tác nhân bằng cách chấp nhận các tùy chọn được đề xuất hoặc tự nhập trực tiếp
- Kế hoạch nêu rõ các giả định (assumptions) để người dùng có thể kiểm chứng và chỉnh sửa
Giai đoạn thiết kế (Design) — tích hợp MCP
- Qua MCP (Model Context Protocol), có thể kết nối trực tiếp ngữ cảnh từ các công cụ bên ngoài như Figma, Linear vào Codex
- Được hỗ trợ trên mọi giao diện: CLI, tiện ích mở rộng IDE và ứng dụng Codex
- Khi tích hợp Figma MCP, chỉ cần dán liên kết thiết kế là Codex có thể lấy ngữ cảnh thiết kế và chuyển thành mã
- Nếu MCP chưa được cấu hình, Codex sẽ tự động hiển thị hướng dẫn cài đặt
- Tích hợp ứng dụng ChatGPT cũng có thể dùng trực tiếp trong Codex thông qua kết nối do bên thứ ba xây dựng
- Nhờ đó, kỹ sư có thể tập trung vào logic cốt lõi, còn nhà thiết kế có thêm thời gian để khám phá nhiều ý tưởng thiết kế hơn
Giai đoạn xây dựng (Build)
- Đây là giai đoạn Codex tạo tác động lớn nhất trong SDLC
- Trong demo, các tác vụ như sửa lỗi kém hiệu quả N+1 query và thêm kiểm thử hồi quy, audit thiếu sót xác thực ở API route, hay migration từ NextAuth v4 sang Auth.js v5 đều được chạy song song
- Kết quả sinh mã dựa trên thiết kế Figma: thay đổi 10 tệp, viết 320 dòng mã, không cần viết tay CSS
- Tính năng Worktree tự động tạo bản sao của dự án cục bộ để tránh xung đột giữa các tác vụ song song, không cần sao chép repository riêng
- Codex tự động chạy các lệnh kiểm chứng, build, lint như
npx tsc, npm test được chỉ định trong agents.md để xác nhận tuân thủ quy ước của nhóm
- Bản thân việc build không còn là nút thắt cổ chai, trong môi trường doanh nghiệp điều quan trọng là xác minh mã có tuân theo quy chuẩn của nhóm hay không
- Có thể mở terminal trực tiếp trong ứng dụng bằng Command+J
- Ngay cả với ứng dụng iOS, cũng có thể chạy
xcode build ngay trong ứng dụng Codex mà không cần mở trực tiếp Xcode
Slash Commands
- CLI, tiện ích mở rộng IDE và ứng dụng Codex đều hỗ trợ slash commands: plan mode, mention tệp, kiểm tra trạng thái phiên, thay đổi quyền hạn, v.v.
- Có thể bật/tắt tính năng thử nghiệm bằng lệnh
/experimental
- Bao gồm cả tính năng tạo multi-agent (sub-agents)
- CLI được tích hợp tính năng mới sớm hơn các giao diện khác một chút
- Các thiết lập được bật ở một giao diện sẽ được phản ánh trên mọi giao diện vì cùng dùng chung backend
Giai đoạn review
- Dùng lệnh
/review để chạy code review cho thay đổi so với nhánh cơ sở hoặc các thay đổi cục bộ chưa commit
- Tác nhân Codex được huấn luyện chuyên biệt để nhận diện lỗi mức P0/P1, nhờ đó cung cấp phản hồi tín hiệu cao với ít nhiễu
- Có thể phát hiện sớm vấn đề ở máy cục bộ trước khi PR đi vào pipeline CI/CD
- Tích hợp GitHub Cloud native: Codex có thể tự động thực hiện code review cho PR theo cách chủ động (proactive) hoặc phản ứng (reactive)
- Có ví dụ về việc phát hiện lỗi P1 trong quy tắc regex, kiểu vấn đề mà con người dễ bỏ sót
- Với các SCM khác như GitLab, Bitbucket, có thể tự xây dựng tích hợp trực tiếp thông qua Codex SDK
- Khi thêm bình luận review trực tiếp trong bảng diff, nội dung đó sẽ tự động được phản ánh vào ngữ cảnh của cuộc trò chuyện tiếp theo
Skills — đóng gói workflow tái sử dụng
- Skill là một tiêu chuẩn mở để đóng gói các chỉ dẫn workflow tái sử dụng mà Codex có thể thực thi
- Về cấu trúc, đó là một thư mục, trong đó tệp bắt buộc là skill.md (metadata + chỉ dẫn cho tác nhân)
- Có thể bổ sung tùy chọn script thực thi, tài liệu và template
- Cũng có thể nhúng MCP bên trong skill để tích hợp công cụ bên ngoài
- Ví dụ demo: xử lý bình luận PR, tự động sửa lỗi build thất bại trên BuildKite, phát hiện dead code
- Skill Creator (system skill): nếu yêu cầu trong cuộc trò chuyện như "create a skill to find dead code paths", hệ thống sẽ tự động scaffold
skill.md
- Skill Installer (system skill): cài ngay skill vừa tạo vào thư mục skill cục bộ của Codex
- Nếu chuyển các workflow lặp lại sau những cuộc trò chuyện dài thành skill, lần sau có thể chạy toàn bộ workflow chỉ với một lần gọi
- Ví dụ GitHub Issue Plan PR skill: từ một prompt duy nhất, thực hiện toàn bộ SDLC gồm triage GitHub issue → lập kế hoạch → chỉnh sửa → tài liệu hóa → tạo draft PR
Giai đoạn tài liệu hóa (Documentation)
- Đây là một trong những lĩnh vực ứng dụng bị đánh giá thấp nhất của Codex
- Hỗ trợ tạo sơ đồ hệ thống, tự động cập nhật tài liệu khi triển khai tính năng, v.v.
- Có demo tích hợp với Linear MCP để tự động ghi lại lên bảng Linear các thay đổi của ticket cụ thể, kết quả kiểm thử hồi quy và nội dung xác minh
Giai đoạn triển khai và bảo trì (Deploy & Maintenance)
- Ngay trong ứng dụng Codex có thể trực tiếp Commit, Push, tạo PR bằng thao tác bấm nút (dựa trên Git)
- Khi dán stack trace, Codex có thể suy luận trên toàn bộ codebase để tìm nguyên nhân sự cố
- Triage Page skill: nhập ID incident là có thể xử lý một cửa từ thu thập chi tiết, xác nhận incident, kiểm tra metric·log đến vá lỗi
- Chuyển việc phản ứng pager duty từ phân tích log thủ công sang mô hình ủy quyền cho tác nhân
- PR Babysitter skill: liên tục theo dõi tiến trình pipeline CI/CD của PR, và khi có vấn đề sẽ tự động sửa để cuối cùng hoàn tất cả việc merge
- Đang được OpenAI dùng thực tế trong môi trường monorepo quy mô lớn
- Có thể tải từ kho skill mã nguồn mở
Automations — chạy tự động theo lịch
- Sau khi đã quen với việc dùng skill, có thể thiết lập để các tác vụ tự chạy theo lịch cụ thể bằng tính năng Automations
- Tự động hóa Sentry skill: mỗi thứ Năm hàng tuần (hoặc mỗi ngày), tìm các issue trong repository cụ thể rồi đề xuất cách sửa hoặc tự động sửa
- Tự động hóa "What is everyone up to?": vào 9 giờ sáng mỗi ngày, xuất bản tóm tắt tình hình hoạt động của các thành viên trong repository
- Ngay cả khi không nhập prompt trực tiếp, Codex vẫn có thể tiếp tục làm việc ở nền
Cơ chế hoạt động của tác nhân Codex
- Tác nhân Codex hoạt động theo vòng lặp: người dùng đưa ra mục tiêu rõ ràng và định hướng ban đầu → tác nhân lặp lại quá trình suy luận, gọi công cụ, đọc tệp, tìm kiếm repository, viết mã và chạy lệnh
- Kết quả từ mỗi công cụ được phản hồi vào lần gọi mô hình tiếp theo để dần xây dựng hiểu biết và tiếp tục tiến triển
- Ngữ cảnh (context) là biến số cốt lõi quyết định hiệu năng của tác nhân: cần cung cấp lượng đầu vào phù hợp để chỉ đúng hướng
- Sandbox ở cấp hệ điều hành: thay vì chỉ dùng các giới hạn nhẹ ở mức harness, hệ thống kiểm soát truy cập mạng và tệp ở cấp OS
- Đây là thiết kế để phòng trường hợp mô hình ngày càng mạnh và có thể vượt qua các lớp bảo vệ nhẹ
- Mọi hệ thống (Mac, Windows) đều hỗ trợ sandbox; trên Windows là Windows sandbox native an toàn hơn WSL
- Có thể cấu hình chi tiết approval mode (thời điểm phê duyệt) và sandbox mode (phạm vi truy cập) trong tệp config TOML
- Mặc định là
on request, vận hành bình thường cho tới khi cần nâng quyền thì tạm dừng
Compaction — quản lý thread dài hạn
- Khi cuộc trò chuyện tiến gần đến giới hạn ngữ cảnh của mô hình, Codex sẽ thực hiện compaction để nén phần đầu cuộc hội thoại
- Compaction được xử lý ở phía máy chủ dựa trên chain of thought thô, nên bảo toàn nội dung thực chất của công việc tốt hơn so với phía máy khách
- Trường hợp thực tế: trong 25 giờ làm việc liên tục, hệ thống đã thực hiện 13~14 lần compaction mà vẫn duy trì được ngữ cảnh
Best practice viết prompt để ủy quyền hiệu quả
- Với prompt tối thiểu, hãy bao gồm mục tiêu rõ ràng, ràng buộc và tiêu chí “hoàn thành”
- Nhúng điều kiện xác minh trực tiếp vào prompt: nêu rõ tiêu chí thành công, các lệnh test·build cần chạy
- Tận dụng prompt mở: hỏi Codex về ý tưởng cải thiện hiệu năng, khu vực thiếu độ bao phủ kiểm thử, v.v. để dùng như một đối tác tư duy
agents.md — tệp chỉ dẫn hành vi cho tác nhân
- Đây là một định dạng mở tương tự Rules của Cursor hay thiết lập của Windsurf, không phải định dạng độc quyền của OpenAI
- Được tự động nạp trong mọi phiên Codex, giúp tạo ra kết quả nhất quán
- Hệ ưu tiên 3 tầng:
- Toàn cục (
~/.codex/agents.md): thiết lập mặc định cá nhân (không phụ thuộc nhóm)
- Gốc repository (
agents.md): quy ước cho toàn bộ repository
- Thư mục con (
agents.md): chỉ dẫn chi tiết theo từng microservice/thư mục con
- Codex sẽ nối (concatenate) các tệp agents.md dọc theo đường dẫn từ gốc dự án tới thư mục hiện tại, trong đó tệp cụ thể hơn sẽ được ưu tiên
- Nội dung nên có: tổng quan repository, lệnh thực thi, kỳ vọng kiểm thử, vị trí các mô-đun chính, hướng dẫn commit/PR
- Có thể tự động tạo agents.md đầu tiên bằng lệnh
/init (CLI), giúp giải quyết vấn đề cold start
- Khuyến nghị giữ ngắn gọn dưới 100 dòng (theo chuẩn agents.md nội bộ của monorepo OpenAI)
- Nếu nội dung dài, nên tách thành các tệp Markdown theo từng tác vụ (planning.md, code-review.md, architecture.md, v.v.) rồi tham chiếu từ agents.md
- Có giới thiệu một mẫu tự động hóa trong đó để Codex phân tích log phiên cục bộ (có cung cấp đường dẫn lưu) và tự đề xuất cải tiến cho agents.md hàng tuần
- Cũng có thể yêu cầu Codex thực hiện retrospective cuộc trò chuyện để tự động phản ánh các gotcha hoặc ghi chú tham khảo vào agents.md
Kết luận — 3 thực hành cốt lõi để bắt đầu với Codex
- Tạo agents.md và cấu hình thiết lập tùy chỉnh
- Giao cho Codex các công việc thực tế, đồng thời kết nối với các công cụ (MCP) mà bạn dùng hằng ngày
- Không chỉ ở giai đoạn build mà hãy vận hành Codex trên toàn bộ vòng lặp phát triển, từ thiết kế đến triển khai và bảo trì, rồi lặp lại liên tục
3 bình luận
OpenAI Academy cũng đã mở gần 1 năm rồi nên hiện đã tích lũy được khá nhiều khóa học hay.
(Nhưng chỉ có phụ đề tiếng Anh được tạo tự động thì hơi đáng tiếc)
Ước gì có phụ đề tiếng Hàn thì tốt, tiếc thật..
Có ai đã nghe cái này chưa?
Có đáng để bỏ ra 1 tiếng không?
Thời đại AI bấm cái là xong nên thời gian quý lắm haha