8 điểm bởi GN⁺ 2025-05-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • Google phát hành sớm Gemini 2.5 Pro Preview (I/O Edition) trước sự kiện I/O chính thức, nhằm phản ánh phản hồi từ nhà phát triển và cải thiện hiệu năng
  • Mô hình thể hiện sức mạnh đặc biệt trong phát triển frontend và UI, với năng lực chuyển đổi, chỉnh sửa mã và suy luận trừu tượng được nâng cao
  • Dựa trên hiệu năng 84,8% ở benchmark VideoMME, giờ đây có thể tự động tạo ứng dụng học tập dựa trên video
  • Thông qua suy luận về thiết kế, cũng có thể dễ dàng tạo UI phù hợp với phong cách và bổ sung tính năng
  • Phiên bản ngày 25 tháng 3 hiện có sẽ tự động được cập nhật lên phiên bản ngày 6 tháng 5, cho phép sử dụng mô hình được cải thiện mà không cần thao tác bổ sung

Hiệu năng nổi bật trong phát triển frontend

  • Gemini 2.5 Pro đứng số 1 trên bảng xếp hạng WebDev Arena
  • Dựa trên tiêu chí UI đẹp mắt và mức độ hoàn thiện chức năng, mô hình chứng minh hiệu năng hàng đầu trong đánh giá mức độ ưa thích của con người
  • Thông qua hợp tác với Cognition và Replit, Google đang mở rộng khả năng của lập trình tác tử

Sự kết hợp giữa khả năng hiểu mã và suy luận

  • Tính năng video → code

    • Với 84,8% trên benchmark VideoMME, mô hình đạt khả năng hiểu video ở mức SOTA
    • Có thể tự động tạo ứng dụng học tập tương tác dựa trên video YouTube
    • Cung cấp kết quả với tổng thể UI và mức độ tương tác được cải thiện so với phiên bản trước
  • Tự động hóa phát triển tính năng

    • Trước đây, cần mở file thiết kế rồi chuyển thủ công màu sắc, phông chữ, margin... sang CSS
    • Gemini 2.5 Pro có thể tự động tạo component phù hợp với phong cách
    • Ví dụ: có thể tự động bổ sung tính năng trình phát video đồng bộ phong cách với ứng dụng Gemini 95
  • Tăng tốc từ ý tưởng → hiện thực hóa ứng dụng

    • Giống như trường hợp ứng dụng dictation starter app, có thể tạo ứng dụng đồng thời cân nhắc cả tính năng và độ hoàn thiện thẩm mỹ
    • Tự động tạo các chi tiết UI tinh vi như hoạt ảnh dạng sóng, thiết kế responsive, hiệu ứng hover chuột
    • Ngay cả khi người dùng không trực tiếp thiết kế, mô hình vẫn tạo ra kết quả mặc định có cảm quan thẩm mỹ tốt

Phản ánh phản hồi từ nhà phát triển và cách sử dụng

  • So với phiên bản trước, mô hình đã giảm tỷ lệ lỗi gọi hàmcải thiện kích hoạt lệnh gọi
  • Phiên bản 03-25 hiện tại sẽ tự động trỏ tới phiên bản 05-06 → được áp dụng mà không cần cập nhật riêng
  • Có thể dùng ngay trên Google AI StudioVertex AI
  • Model Card cũng đã được cập nhật với thông tin mới nhất
  • Tự động cập nhật lên phiên bản mới nhất và được cung cấp mà không thay đổi giá

Ứng dụng và kỳ vọng

  • Replit, Cursor, Cognition... đang xem xét triển khai hoặc đã áp dụng mô hình này như tác tử lập trình thế hệ tiếp theo
  • Từ nhà phát triển cá nhân đến doanh nghiệp, mô hình được kỳ vọng sẽ góp phần mở rộng quy trình phát triển kiểu tác tử

1 bình luận

 
GN⁺ 2025-05-07
Ý kiến trên Hacker News
  • Trước đây, khi dùng các mô hình như thế này để lập trình, điều gây khó chịu lớn nhất là chúng có xu hướng tưởng tượng ra các API không tồn tại. Các mô hình Gemini 2.5, đặc biệt là bản Pro và Flash, ít gặp vấn đề này hơn các mô hình khác

    • Dù vậy vẫn còn những giới hạn đáng kể, và các mô hình hiện tại chưa thể tiếp cận trừu tượng hóa và kiến trúc như con người
    • Tuy nhiên, các mô hình Gemini đã có thể thay thế tìm kiếm và Stack Overflow trong công việc lập trình hằng ngày
  • Gemini 2.5 Pro đứng đầu bảng xếp hạng WebDev Arena

    • Có lẽ hợp lý hơn nếu đổi tên WebDev Arena thành React/Tailwind Arena
    • Prompt hệ thống yêu cầu các công nghệ này, và khi yêu cầu vanilla JS hoặc framework khác thì toàn bộ công cụ không hoạt động
    • Việc các mô hình cạnh tranh trong một định nghĩa quá hẹp về phát triển web là một vấn đề
  • Khi yêu cầu Gemini 2.5 viết mã, đầu ra có quá nhiều chú thích

    • Bao gồm số lượng chú thích quá mức như chú thích theo mục, chú thích theo bước, chú thích khối, chú thích nội tuyến, v.v.
  • Gemini 2.5 rất mạnh ở các tác vụ dạng agent, nhưng vẫn gặp khó khăn trong việc tạo ra diff hoàn hảo để chỉnh sửa mã

    • Gemini 2.5 thế hệ cũ tạo ra diff phù hợp với độ chính xác 92%
    • Dự kiến tỷ lệ này sẽ tăng lên 95-98%
  • Câu hỏi dành cho phía Google: không rõ Gemini-2.5-pro-exp (bản miễn phí) cũng đã được cập nhật hay sẽ biến mất

    • Theo bài đăng blog, phiên bản trước đó (03-25) hiện trỏ đến phiên bản mới nhất (05-06), và không cần thêm thao tác nào để dùng mô hình đã cải thiện
    • Không rõ Gemini-2.5-pro-preview-03-25 giờ đã dùng 05-06 chưa, và liệu Gemini-2.5-pro-exp-03-25 có được áp dụng tương tự không
  • Khi so sánh benchmark giữa bản thử nghiệm 03-25 và bản thử nghiệm 05-06, phiên bản mới đạt điểm thấp hơn một chút ở mọi hạng mục ngoại trừ LiveCodeBench

  • Dùng Gemini cho gần như mọi thứ, nhưng model card chỉ so sánh với o3-mini

    • Trên các benchmark đã biết, o3 vẫn đang dẫn trước
  • Gemini 2.5 pro rất tốt, nhưng UI vẫn có vấn đề cuộn khiến nó khó sử dụng

    • Tốt hơn là nên chờ vài phút sau khi đầu ra AI hoàn tất
    • Trong công cụ dành cho nhà phát triển, cũng có thể tìm phần tử ms-code-block rồi ghi lại $0.textContext, cách này cũng đáng tin cậy
  • Gemini 2.5 pro rất tốt, nhưng chi phí rất đắt và thông tin chi tiết về chi phí lại thiếu minh bạch

    • Gần đây nhiều người nhận hóa đơn ngoài dự kiến, một số người bị tính tới $500 chỉ với mức sử dụng bình thường
    • Tôi cũng bị ảnh hưởng nên đã gỡ API key khỏi công cụ
  • Mô hình này có hiệu năng kém hơn bản 03-25 ở 10 trên 12 benchmark

    • Họ tiếp tục huấn luyện cho coding nhưng mọi thứ lại tệ hơn, và có thể đã cố che giấu điều đó vì chi phí chìm
  • Không rõ vì sao không thể dùng số phiên bản thay vì gọi là "bản preview mới"

    • Ví dụ, có thể gọi là Gemini Pro 2.5.1