- Gemini 3 của Google đã phát triển vượt xa một chatbot hội thoại đơn thuần, trở thành AI kiểu cộng sự số có thể thực hiện công việc thực tế như viết mã, duyệt web, thao tác tệp
- Antigravity được công bố cùng lúc là một công cụ dựa trên tác nhân có thể truy cập máy tính của người dùng để tự động viết chương trình, đồng thời yêu cầu phê duyệt hoặc trợ giúp thông qua hệ thống Inbox
- Gemini 3 có thể làm cả xây dựng website, phân tích dữ liệu, viết luận văn nghiên cứu theo chỉ thị của người dùng, cho thấy năng lực nghiên cứu ở mức PhD
- Dù lỗi vẫn còn tồn tại, chúng chủ yếu ở mức khác biệt về phán đoán và mức độ hiểu, khiến nó gần hơn với hình thức “đồng đội AI” hợp tác cùng con người
- Bài viết nhấn mạnh rằng “chúng ta đang chuyển từ kỷ nguyên chatbot sang kỷ nguyên cộng sự số”, và con người giờ đây không còn chỉ là người sửa lỗi cho AI mà đang dần trở thành người quản lý, điều phối công việc của AI
Sự xuất hiện của Gemini 3 và thay đổi trong 3 năm
- Google Gemini 3, xuất hiện chỉ khoảng 3 năm sau khi ChatGPT ra mắt, là một ví dụ cho thấy tốc độ phát triển của AI
- Ở thời GPT-3.5 năm 2022, AI mới chỉ đạt mức tạo ra các đoạn văn hay bài thơ đơn giản
- Đến năm 2025, Gemini 3 đã tiến hóa tới mức trực tiếp lập trình và thiết kế trò chơi tương tác
- Theo yêu cầu của người dùng, Gemini 3 đã tạo ra một trò chơi có thể chơi được thực sự mang tên “Candy-Powered FTL Starship Simulator”
- Điều này cho thấy AI đã tiến hóa từ giai đoạn chỉ mô tả bằng văn bản sang giai đoạn trực tiếp triển khai mã và giao diện
Antigravity và AI kiểu tác nhân
- Google đã công bố công cụ dành cho nhà phát triển tên là Antigravity cùng với Gemini 3
- Tương tự Claude Code hay OpenAI Codex, đây là hệ thống có thể truy cập máy tính của người dùng và tự động viết mã
- Antigravity đưa vào khái niệm Inbox, gửi thông báo cho người dùng khi AI cần phê duyệt hoặc trợ giúp trong lúc làm việc
- Người dùng ra lệnh bằng tiếng Anh, và AI thực thi chúng bằng mã
- Ví dụ, nó phân tích các tệp bài viết newsletter của tác giả và tự động tạo một website tổng hợp các dự đoán liên quan đến AI
- AI thực hiện tìm kiếm web, chạy mã, kiểm thử trên trình duyệt, rồi đóng gói kết quả ở dạng có thể triển khai lên Netlify
Gemini 3 như một AI cộng tác
- Gemini 3 chia sẻ tiến độ một cách minh bạch trong quá trình làm việc thông qua yêu cầu người dùng phê duyệt
- Người dùng hợp tác bằng cách xem xét và chỉnh sửa các đề xuất của AI
- Trải nghiệm này gần với “quản lý AI” hơn
- AI chưa hoàn hảo, nhưng lỗi chủ yếu ở mức khác biệt trong phán đoán hoặc hiểu sai ý định, còn vấn đề hallucination kiểu cũ hầu như không còn
- Việc cộng tác với Gemini 3 được ví như “quản lý một thành viên trong nhóm”, nhấn mạnh kiểu tương tác vượt xa việc chỉ nhập prompt đơn thuần
Năng lực thực hiện nghiên cứu và đánh giá “mức PhD”
- Gemini 3 thực hiện các nhiệm vụ phân tích bộ dữ liệu nghiên cứu và viết luận văn
- Nó khôi phục và sắp xếp lại các tệp dữ liệu crowdfunding cũ, đồng thời tiến hành phân tích mới
- Nó viết một bài nghiên cứu dài 14 trang về chủ đề “khởi nghiệp và chiến lược kinh doanh”
- AI tự xây dựng giả thuyết, thực hiện phân tích thống kê và tạo ra chỉ số riêng (đo lường tính độc đáo của ý tưởng)
- Thành phẩm cho thấy mức độ hoàn thiện tương đương học viên cao học, dù một số kỹ thuật thống kê và triển khai lý thuyết còn yếu
- Nếu được đưa thêm chỉ thị, chất lượng cải thiện đáng kể
- Tác giả đánh giá rằng “trí tuệ ở mức PhD không còn xa”
Chuyển dịch sang cộng sự số
- Gemini 3 là AI kiểu đối tác có thể suy nghĩ và hành động, và hàng tỷ người trên toàn thế giới có thể tiếp cận
- Không có dấu hiệu chững lại trong tiến bộ của AI, trong khi sự trỗi dậy của các mô hình kiểu tác nhân và tầm quan trọng của năng lực quản lý AI ngày càng nổi bật
- Tác giả mô tả rằng “kỷ nguyên chatbot đang chuyển sang kỷ nguyên cộng sự số”
- Con người giờ đây không còn chỉ là người sửa lỗi cho AI, mà đang dần trở thành người quản lý điều phối công việc của AI
- Cuối bài, Gemini 3 còn trình diễn khả năng sáng tạo vượt ra ngoài văn bản, như tạo ảnh bìa cho blog chỉ bằng mã
- Tuy nhiên, cần lưu ý rằng việc cấp quyền truy cập máy tính cho AI vẫn tiềm ẩn rủi ro bảo mật
1 bình luận
Ý kiến trên Hacker News
Mỗi khi đọc những bài như thế này, tôi luôn thấy thiếu một phần — đó là câu hỏi "có tốt không, có chính xác không"
edgeDetect(image), thì mỗi model thành công hay không lại khác nhauĐiều thú vị là cho đến nay, cách con người tương tác với AI phần lớn vẫn xoay quanh hộp văn bản
Vấn đề "ảo giác" (hallucination) vẫn còn tồn tại
Với câu hỏi "có phải trí thông minh cấp độ PhD không?", là một nghiên cứu sinh, tôi có cảm giác khá giống như vậy
Tiến bộ của Google không chỉ đến từ phần mềm mà còn từ phần cứng
Gemini 3 rất ấn tượng nhưng vẫn cho cảm giác bị giới hạn trong ranh giới của tài liệu hiện có
Thời điểm phát hành GPT-3 là tháng 6 năm 2020, còn ChatGPT là phiên bản 3.5
Tôi đã nghe từ lâu nhận định rằng "Human in the loop" đang tiến hóa từ con người sửa lỗi cho AI thành con người chỉ huy AI
Tôi có chút nghi ngờ liệu việc chạy trực tiếp trên hệ thống cục bộ các công cụ như Claude Code hay Antigrav có an toàn không