- Google phát hành sớm Gemini 2.5 Pro Preview (I/O Edition) trước sự kiện I/O chính thức, nhằm phản ánh phản hồi từ nhà phát triển và cải thiện hiệu năng
- Mô hình thể hiện sức mạnh đặc biệt trong phát triển frontend và UI, với năng lực chuyển đổi, chỉnh sửa mã và suy luận trừu tượng được nâng cao
- Dựa trên hiệu năng 84,8% ở benchmark VideoMME, giờ đây có thể tự động tạo ứng dụng học tập dựa trên video
- Thông qua suy luận về thiết kế, cũng có thể dễ dàng tạo UI phù hợp với phong cách và bổ sung tính năng
- Phiên bản ngày 25 tháng 3 hiện có sẽ tự động được cập nhật lên phiên bản ngày 6 tháng 5, cho phép sử dụng mô hình được cải thiện mà không cần thao tác bổ sung
Hiệu năng nổi bật trong phát triển frontend
- Gemini 2.5 Pro đứng số 1 trên bảng xếp hạng WebDev Arena
- Dựa trên tiêu chí UI đẹp mắt và mức độ hoàn thiện chức năng, mô hình chứng minh hiệu năng hàng đầu trong đánh giá mức độ ưa thích của con người
- Thông qua hợp tác với Cognition và Replit, Google đang mở rộng khả năng của lập trình tác tử
Sự kết hợp giữa khả năng hiểu mã và suy luận
-
Tính năng video → code
- Với 84,8% trên benchmark VideoMME, mô hình đạt khả năng hiểu video ở mức SOTA
- Có thể tự động tạo ứng dụng học tập tương tác dựa trên video YouTube
- Cung cấp kết quả với tổng thể UI và mức độ tương tác được cải thiện so với phiên bản trước
-
Tự động hóa phát triển tính năng
- Trước đây, cần mở file thiết kế rồi chuyển thủ công màu sắc, phông chữ, margin... sang CSS
- Gemini 2.5 Pro có thể tự động tạo component phù hợp với phong cách
- Ví dụ: có thể tự động bổ sung tính năng trình phát video đồng bộ phong cách với ứng dụng Gemini 95
-
Tăng tốc từ ý tưởng → hiện thực hóa ứng dụng
- Giống như trường hợp ứng dụng dictation starter app, có thể tạo ứng dụng đồng thời cân nhắc cả tính năng và độ hoàn thiện thẩm mỹ
- Tự động tạo các chi tiết UI tinh vi như hoạt ảnh dạng sóng, thiết kế responsive, hiệu ứng hover chuột
- Ngay cả khi người dùng không trực tiếp thiết kế, mô hình vẫn tạo ra kết quả mặc định có cảm quan thẩm mỹ tốt
Phản ánh phản hồi từ nhà phát triển và cách sử dụng
- So với phiên bản trước, mô hình đã giảm tỷ lệ lỗi gọi hàm và cải thiện kích hoạt lệnh gọi
- Phiên bản 03-25 hiện tại sẽ tự động trỏ tới phiên bản 05-06 → được áp dụng mà không cần cập nhật riêng
- Có thể dùng ngay trên Google AI Studio và Vertex AI
- Model Card cũng đã được cập nhật với thông tin mới nhất
- Tự động cập nhật lên phiên bản mới nhất và được cung cấp mà không thay đổi giá
Ứng dụng và kỳ vọng
- Replit, Cursor, Cognition... đang xem xét triển khai hoặc đã áp dụng mô hình này như tác tử lập trình thế hệ tiếp theo
- Từ nhà phát triển cá nhân đến doanh nghiệp, mô hình được kỳ vọng sẽ góp phần mở rộng quy trình phát triển kiểu tác tử
1 bình luận
Ý kiến trên Hacker News
Trước đây, khi dùng các mô hình như thế này để lập trình, điều gây khó chịu lớn nhất là chúng có xu hướng tưởng tượng ra các API không tồn tại. Các mô hình Gemini 2.5, đặc biệt là bản Pro và Flash, ít gặp vấn đề này hơn các mô hình khác
Gemini 2.5 Pro đứng đầu bảng xếp hạng WebDev Arena
Khi yêu cầu Gemini 2.5 viết mã, đầu ra có quá nhiều chú thích
Gemini 2.5 rất mạnh ở các tác vụ dạng agent, nhưng vẫn gặp khó khăn trong việc tạo ra diff hoàn hảo để chỉnh sửa mã
Câu hỏi dành cho phía Google: không rõ Gemini-2.5-pro-exp (bản miễn phí) cũng đã được cập nhật hay sẽ biến mất
Khi so sánh benchmark giữa bản thử nghiệm 03-25 và bản thử nghiệm 05-06, phiên bản mới đạt điểm thấp hơn một chút ở mọi hạng mục ngoại trừ LiveCodeBench
Dùng Gemini cho gần như mọi thứ, nhưng model card chỉ so sánh với o3-mini
Gemini 2.5 pro rất tốt, nhưng UI vẫn có vấn đề cuộn khiến nó khó sử dụng
ms-code-blockrồi ghi lại$0.textContext, cách này cũng đáng tin cậyGemini 2.5 pro rất tốt, nhưng chi phí rất đắt và thông tin chi tiết về chi phí lại thiếu minh bạch
Mô hình này có hiệu năng kém hơn bản 03-25 ở 10 trên 12 benchmark
Không rõ vì sao không thể dùng số phiên bản thay vì gọi là "bản preview mới"