- Ứng dụng Codex đã được cập nhật lớn, giờ đây có thể thực hiện toàn bộ quy trình phát triển phần mềm trong một workspace duy nhất
- Có thể điều khiển trực tiếp máy tính, dùng cùng các công cụ và ứng dụng phục vụ công việc hằng ngày, đồng thời bổ sung tạo ảnh, học từ hành vi trước đó, thực hiện tác vụ lặp lại để tự động hóa và mở rộng workflow phát triển
- Ứng dụng desktop nay bao gồm review PR, chế độ xem nhiều file/terminal, kết nối devbox từ xa qua SSH, và trình duyệt trong ứng dụng, giúp tăng tốc thiết kế frontend và các vòng lặp làm ứng dụng/game
- Tích hợp hơn 90 plugin và mô hình gpt-image-1.5, mang lại một môi trường liền mạch từ viết mã đến thiết kế, kiểm thử và cộng tác
- Tái sử dụng các luồng hội thoại hiện có, cùng với tự động lên lịch công việc dài hạn và bản xem trước bộ nhớ, giúp duy trì tính liên tục cho công việc kéo dài từ vài ngày đến vài tuần
Các cập nhật chính của Codex
- Ứng dụng Codex đã có bản cập nhật lớn cho macOS và Windows, mở rộng thành công cụ hỗ trợ toàn bộ quy trình phát triển phần mềm cho hơn 3 triệu người dùng phát triển hoạt động hằng tuần
- Phiên bản mới bổ sung các tính năng điều khiển máy tính, tạo ảnh, bộ nhớ, plugin, trình duyệt trong ứng dụng, giúp tăng tốc workflow của nhà phát triển
- Các tính năng tập trung vào phát triển như review PR, chế độ xem nhiều file và terminal, kết nối devbox từ xa qua SSH được tăng cường
- Mọi cải tiến đều được tích hợp để viết mã, kiểm tra đầu ra, rà soát thay đổi và cộng tác trong một workspace duy nhất
-
Điều khiển máy tính và công việc song song
- Thông qua tính năng điều khiển máy tính chạy nền, có thể trực tiếp click, nhập liệu và điều hướng trên máy tính của người dùng
- Dùng con trỏ riêng để thao tác ứng dụng, cho phép kiểm thử hoặc thực hiện tác vụ lặp lại ngay cả với các ứng dụng không có API
- Nhiều agent có thể đồng thời làm việc song song trên Mac mà không can thiệp vào công việc của người dùng trên các ứng dụng khác
- Hữu ích cho lặp lại thay đổi frontend, kiểm thử ứng dụng, làm việc trong môi trường không có API
-
Tích hợp web và trình duyệt
- Tích hợp tự nhiên với web, cho phép dùng trình duyệt trong ứng dụng để chú thích trực tiếp trên trang web và đưa ra chỉ dẫn cụ thể cho Codex
- Hiện tại hữu ích cho phát triển frontend và game, và trong tương lai dự kiến sẽ mở rộng từ web app localhost sang khả năng điều khiển hoàn toàn trình duyệt
-
Tạo ảnh và workflow trực quan
- Dùng mô hình gpt-image-1.5 để tạo ảnh và thực hiện các tác vụ lặp lại
- Kết hợp ảnh chụp màn hình với mã để tạo ý tưởng sản phẩm, thiết kế frontend, mockup, hình ảnh game ngay trong cùng một workflow
-
Mở rộng bằng plugin
- Bổ sung hơn 90 plugin mới, hỗ trợ tích hợp với nhiều ứng dụng và máy chủ MCP
- Các plugin chính: Atlassian Rovo (quản lý JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- Plugin cho phép Codex thu thập nhiều ngữ cảnh hơn và thực hiện công việc tự động
-
Tăng cường workflow cho nhà phát triển
- Hỗ trợ xử lý comment review trên GitHub, chạy nhiều tab terminal, kết nối devbox từ xa qua SSH (giai đoạn alpha)
- Có thể mở trực tiếp file từ sidebar và cung cấp rich preview cho PDF, bảng tính, slide, tài liệu
- Cung cấp bảng tóm tắt mới (summary pane) để theo dõi kế hoạch, nguồn và đầu ra của agent
- Có thể di chuyển giữa viết mã, kiểm tra đầu ra, review thay đổi và cộng tác cùng agent trong một workspace, giúp tăng tốc chuyển đổi giữa các giai đoạn của vòng đời phát triển
-
Tự động hóa và công việc dài hạn
- Tính năng tự động hóa được mở rộng để tái sử dụng các luồng hội thoại hiện có và giữ lại ngữ cảnh đã tích lũy
- Codex có thể tự lên lịch các công việc tiếp theo và tự động tiếp tục, cho phép duy trì công việc dài hạn kéo dài từ vài ngày đến vài tuần
- Trường hợp sử dụng trong nhóm: merge các PR đang mở, theo dõi công việc tiếp theo, bám sát các cuộc trao đổi nhanh trên nhiều công cụ như Slack, Gmail, Notion
-
Bộ nhớ và cá nhân hóa
- Với bản xem trước tính năng bộ nhớ (preview of memory), Codex ghi nhớ các ngữ cảnh hữu ích trong quá khứ như sở thích cá nhân, chỉnh sửa, thông tin đã thu thập
- Trong các công việc sau này, có thể đạt được mức chất lượng và tốc độ trước đây chỉ có thể có nhờ các custom instruction rất rộng
- Codex chủ động đề xuất tiếp tục từ điểm đã dừng, đồng thời tận dụng dự án, plugin đã kết nối và ngữ cảnh bộ nhớ để tự động tạo đề xuất công việc và danh sách ưu tiên
- Ví dụ: xác định comment cần kiểm tra trong Google Docs → thu thập ngữ cảnh liên quan từ Slack, Notion và codebase → cung cấp danh sách hành động đã được sắp ưu tiên
-
Kế hoạch triển khai và phạm vi cung cấp
- Đang được triển khai dần cho người dùng ứng dụng desktop Codex đăng nhập bằng tài khoản ChatGPT
- Tính năng cá nhân hóa (đề xuất nhận biết ngữ cảnh, bộ nhớ) sẽ sớm được cung cấp cho người dùng Enterprise, Edu, EU và UK
- Tính năng điều khiển máy tính sẽ được cung cấp trước trên macOS, sau đó mở rộng sang khu vực EU và UK
Sự tiến hóa và mục tiêu của Codex
- Chỉ sau 1 năm ra mắt, Codex đã mở rộng phạm vi sử dụng từ viết mã sang hiểu hệ thống, thu thập ngữ cảnh, review, debug, cộng tác và quản lý công việc dài hạn
- OpenAI đặt mục tiêu để AGI mang lại lợi ích cho toàn nhân loại, và bản cập nhật lần này được thiết kế theo hướng thu hẹp khoảng cách giữa những gì con người có thể hình dung và những gì thực sự có thể xây dựng
- Trong tương lai, Codex sẽ tiếp tục tích hợp chặt chẽ hơn với các công cụ, workflow và quyết định trong quá trình phát triển phần mềm
6 bình luận
Bản trả phí của Opecnclaw à…
Windows thì vẫn chưa đúng không? Đây là bản cập nhật cho Mac đúng không?
Khi nhờ làm thiết kế web thì lúc nào cũng triển khai theo kiểu thẻ, không biết bao giờ mới sửa được cái này. Chỉ cần sửa đúng điểm này thôi là chắc tôi sẽ không dùng Claude nữa.
Trước giờ tôi chỉ dùng bằng cách kết nối qua VSCode, chắc phải thử bằng app thôi.
Với tôi thì dạo này Codex gần như là chính, nên đây đúng là một bản cập nhật rất đáng mừng.
openai-oauth - Dùng miễn phí OpenAI API bằng tài khoản ChatGPT
Nếu dùng cái này thì giờ có lẽ tạo ảnh cũng sẽ được nữa.
Ý kiến trên Hacker News
Đọc các bình luận thì có vẻ nhiều người không biết rằng Claude Desktop và Cowork đã cung cấp những tính năng kiểu này rồi
Cảm giác Codex không phải là đổi mới mà chỉ đang bắt kịp
OpenAI có ít khách hàng enterprise hơn nên có thể trợ giá nhiều tài nguyên tính toán hơn cho người dùng cá nhân
Cuối cùng khi số người dùng tăng lên thì họ cũng sẽ giống Anthropic thôi. Hiện tại đây chỉ là chiến lược PR
Codex có thể nhấp vào ứng dụng và gõ phím trong nền, đồng thời nhiều agent có thể làm việc cùng lúc
Như tôi đã nói trong bài blog, AI cần làm việc chủ động hơn
Ví dụ như tóm tắt Slack, hợp nhất biên bản họp, tự động tạo ghi chú chuẩn bị cho cuộc họp, những thứ này đã làm được rồi nhưng chẳng ai làm
Cuối cùng điều quan trọng là quản lý sự chú ý, và AI nên giúp chúng ta biết cần tập trung vào đâu
Nhìn vào UI dạo này thì thấy xu hướng che giấu code rất mạnh
Prompt mới là nguồn thực sự, còn code bị đối xử như một sản phẩm trung gian phiền phức
Làm vậy thì vừa nhanh hơn, vừa cho ra kết quả giống như chính tôi viết
Chúng ta vốn đã biết cách tự động hóa, nhưng đa số mọi người thì không
Bây giờ ngôn ngữ bậc cao có vẻ lạ lẫm, nhưng rốt cuộc đó chỉ là quá trình tăng thêm các tầng trừu tượng
Prompt engineering rốt cuộc cũng chỉ là một hệ ngôn ngữ nhân tạo khác
Dù có nhiều góc nhìn hoài nghi, tôi nghĩ thứ này sẽ phổ biến rộng rãi
Tôi đã dùng CLI suốt 25 năm, nhưng dạo này lại dùng Codex thay cho các tác vụ terminal
Nếu bản GUI được làm tốt thì người dùng phổ thông cũng sẽ nhanh chóng quen thôi
Những thiết lập trước đây mất hàng giờ thì giờ chỉ cần vài giây
Trừ những ứng dụng cần GUI, hầu hết tác vụ đều có thể làm bằng AI dạng văn bản
Tôi không chắc mình có thật sự muốn Codex trực tiếp điều khiển máy tính và ứng dụng hay không
Tôi vẫn rất coi trọng bảo mật sandbox
Có vẻ OpenAI chuẩn bị sẵn các bản phát hành không công khai để tung ra đúng lúc đối thủ công bố sản phẩm
Lịch với báo chí và influencer thì được điều phối trước
Prompt trong video thứ hai là “hãy giảm độ dài của font và tagline”
Khiến tôi có cảm giác giờ người ta còn dùng LLM để chỉnh cỡ font nữa sao
Trong video thứ ba thì là “hãy tạo hình ảnh cho hero section”,
dùng ảnh do AI tạo trong phần mô tả sản phẩm trông quá giả tạo
Thành thật mà nói tôi không biết nên dùng cái này vào việc gì
Nó hữu ích như công cụ hỗ trợ code, nhưng tôi không muốn để nó trực tiếp thao tác máy tính của mình
Nếu chỉ là tóm tắt Slack thì còn được, nhưng hiện giờ nó giống một giải pháp đi giải quyết vấn đề vốn không có vấn đề
Tôi nghĩ các agent chuyên biệt như Cowork/Codex sẽ là nhóm sản phẩm tăng trưởng nhanh nhất cho người không phải lập trình viên
Các agent như vậy sẽ thay con người thao tác phần mềm
Như đã tổng hợp trong bài viết liên quan,
rốt cuộc cấu trúc của chính thị trường phần mềm sẽ thay đổi
Đồng nghĩa rủi ro bảo mật cũng tăng lên
Nó đọc email và biên bản họp, lập kế hoạch và thực thi công việc, rồi còn gửi cả phần tóm tắt
Điều đó khả thi vì phần lớn công việc tri thức cuối cùng đều có thể biểu diễn dưới dạng code
Chỉ cần kết nối dữ liệu tốt là thị trường B2B SaaS sẽ mở ra
Tôi vẫn thắc mắc liệu Codex có còn đọc các tệp nhạy cảm mà không có sự đồng ý của người dùng hay không
Có issue liên quan trên GitHub
sẽ an toàn hơn nếu chạy trên một máy riêng biệt không chứa dữ liệu nhạy cảm
Tên gọi Codex gây nhầm lẫn
Một cái là công cụ lập trình kiểu agent, cái còn lại là ứng dụng GUI cho Mac/Windows, nhưng lại cùng một tên