- Google đã công bố các bản preview mới của Gemini 2.5 Flash và 2.5 Flash-Lite, với trọng tâm là nâng cao chất lượng và cải thiện hiệu quả
- Flash-Lite được tăng cường khả năng hiểu chỉ thị, giảm câu trả lời dài dòng, cải thiện năng lực đa phương thức và dịch thuật, tối ưu cho môi trường tốc độ cao và chi phí thấp
- Flash được nâng cao khả năng sử dụng công cụ, cải thiện hiệu quả token, giúp tăng mạnh hiệu năng trong các tác vụ dạng agent phức tạp
- Trong các bài kiểm thử thực tế, điểm SWE-Bench Verified tăng 5%, còn trong benchmark nội bộ, hiệu năng ở các tác vụ dài hạn cải thiện 15%
- Cả hai mô hình đều hỗ trợ bí danh
-latest để dùng tính năng mới nhất mà không cần sửa mã, còn nếu cần sự ổn định thì vẫn có thể tiếp tục dùng các mô hình 2.5 hiện có
Tổng quan về Gemini 2.5 Flash và Flash-Lite
- Các phiên bản mới nhất của Gemini 2.5 Flash và Flash-Lite đã được công bố trên Google AI Studio và Vertex AI. Mục tiêu của lần phát hành này là tiếp tục mang lại chất lượng mô hình tốt hơn và hiệu quả cao hơn
- Flash-Lite và Flash mới cho thấy hiệu năng được cải thiện đáng kể so với các mô hình trước đó trên các phương diện chất lượng tổng thể, tốc độ và chi phí
- Flash-Lite giảm 50% token đầu ra, còn Flash giảm 24%, giúp tiết kiệm chi phí vận hành và tăng tốc độ xử lý
Gemini 2.5 Flash-Lite được cập nhật
- Cải thiện khả năng làm theo lệnh: Năng lực hiểu và thực thi trong các chỉ thị phức tạp hoặc system prompt được nâng cao đáng kể
- Tăng độ súc tích: Tạo phản hồi ngắn hơn và dễ hiểu hơn, giúp giảm chi phí token và độ trễ trong môi trường lưu lượng lớn
- Nâng cao chất lượng đa phương thức và dịch thuật: Độ tin cậy đều tăng lên ở ghi âm audio, nhận diện hình ảnh và chất lượng dịch thuật
- Có thể thử ngay bản preview Flash-Lite với tên mô hình
gemini-2.5-flash-lite-preview-09-2025
Gemini 2.5 Flash được cập nhật
- Tăng cường khả năng dùng công cụ: Khả năng ứng dụng theo hướng agent trong các tình huống đa bước phức tạp được nâng lên rõ rệt, đạt hiệu năng cao hơn 5 điểm phần trăm theo SWE-Bench Verified so với phiên bản trước (48.9% → 54%)
- Cải thiện hiệu quả chi phí: Dùng ít token hơn nhưng cho chất lượng đầu ra cao hơn, giúp giảm độ trễ và chi phí hạ tầng
- Phản hồi từ những người dùng Primer cũng tích cực
- Yichao ‘Peak’ Ji, đồng sáng lập kiêm Chief Scientist của Manus, đánh giá: “Mô hình Gemini 2.5 Flash mới mang lại cả tốc độ lẫn trí tuệ ấn tượng. Hiệu năng trong các tác vụ agent dựa trên mục tiêu dài hạn đã cải thiện 15%, giúp mở rộng quy mô hơn nữa nhờ hiệu quả chi phí”
- Bản preview của Gemini 2.5 Flash có thể dùng với tên mô hình
gemini-2.5-flash-preview-09-2025
Bắt đầu xây dựng với Gemini
- Trong năm qua, việc phát hành các mô hình preview đã giúp nhà phát triển nhanh chóng thử nghiệm tính năng mới nhất và gửi phản hồi.
- Bản preview được công bố hôm nay không phải là chuyển đổi chính thức sang phiên bản ổn định (stable) mới, mà được dùng làm nền tảng để nâng cao chất lượng cho bản chính thức tiếp theo
- Ngoài các tên mô hình dài dòng, Google đã thêm bí danh
-latest để luôn có thể dùng mô hình mới nhất một cách dễ dàng. Bí danh này sẽ tự động trỏ tới phiên bản mới nhất, cho phép thử tính năng mới mà không cần sửa mã
gemini-flash-latest
gemini-flash-lite-latest
- Nếu một phiên bản cụ thể được cập nhật hoặc ngừng cung cấp, sẽ có email thông báo trước ít nhất 2 tuần. Bí danh chỉ là tham chiếu đơn giản, còn giá, tính năng và hạn mức có thể khác nhau theo từng bản phát hành
- Nếu cần sự ổn định dài hạn, nên tiếp tục dùng các tên mô hình
gemini-2.5-flash và gemini-2.5-flash-lite hiện có
Ý nghĩa
- Đợt phát hành này là bản cập nhật preview chứ không phải nâng cấp lên bản ổn định chính thức, và là một phần của quá trình thử nghiệm cũng như thu thập phản hồi người dùng cho các mô hình ổn định trong tương lai
- Google đang tiếp tục cải tiến Gemini để theo đuổi sự cân bằng giữa tốc độ, trí tuệ và hiệu quả chi phí, qua đó giúp nhà phát triển xây dựng các ứng dụng AI tốt hơn
1 bình luận
Ý kiến trên Hacker News
Ghi chú phát hành xem ở đây. Thảo luận liên quan đến bồ nông xem bài này