Gemini 2.5 Deep Think khả dụng trên ứng dụng Gemini
(blog.google)- Gemini 2.5 Deep Think đã được đưa vào ứng dụng Gemini dành riêng cho người đăng ký Google AI Ultra
- Kỹ thuật suy luận song song (parallel thinking) mới và kết quả nghiên cứu mới nhất đã được phản ánh, cải tiến để sử dụng thực tế hơn dựa trên mô hình đạt huy chương vàng tại IMO
- Thể hiện hiệu năng vượt trội trong nhiều nhiệm vụ phức tạp như giải quyết vấn đề sáng tạo, suy luận toán học và khoa học, cũng như phát triển thuật toán
- Để nâng cao hiệu năng, thời gian suy luận (Thinking Time) được tăng để cùng lúc khám phá nhiều ý tưởng và lời giải, từ đó tạo ra suy nghĩ sâu hơn và kết quả sáng tạo hơn
- Đã tăng cường đánh giá và biện pháp cho an toàn và phát triển AI có trách nhiệm, đồng thời công bố kế hoạch mở rộng sử dụng qua API và doanh nghiệp
Ra mắt Gemini 2.5 Deep Think
- Gemini 2.5 Deep Think được cung cấp cho người đăng ký Google AI Ultra qua ứng dụng Gemini
- Phiên bản này đã phản ánh phản hồi từ các nhóm thử nghiệm đáng tin cậy và đội ngũ nghiên cứu
- Dựa trên mô hình cấp huy chương vàng tại Olympic Toán Quốc tế (IMO) gần đây, tốc độ và tính thực dụng đã được tối ưu để phù hợp hơn với trải nghiệm người dùng thực tế
- Việc công bố này mở rộng khả năng hoạt động của Gemini như một công cụ giải quyết vấn đề sáng tạo, và kế hoạch nâng cấp chức năng dựa trên phản hồi từ các nhà toán học và nhà nghiên cứu sẽ tiếp tục được triển khai
Nguyên lý hoạt động của Deep Think
- Áp dụng kỹ thuật suy nghĩ song song, Gemini đồng thời dò tìm và so sánh/ghép nối nhiều ý tưởng và lời giải cho các vấn đề phức tạp
- Tăng thời gian suy luận (Thinking Time) của mô hình để sâu hơn trong việc khám phá nhiều giả thuyết, giúp tìm ra giải pháp sáng tạo hơn
- Được huấn luyện bằng học tăng cường để tận dụng tích cực các đường dẫn suy luận mở rộng này, tăng cường khả năng giải quyết vấn đề sâu sắc và trực giác hơn
Hiệu năng và ứng dụng chính của Deep Think
- Phát triển và thiết kế theo từng bước: Đạt hiệu năng cao trong các nhiệm vụ cải tiến hệ thống hoặc thiết kế phức tạp theo từng giai đoạn
- Khám phá khoa học và toán học: Mạnh trong các nghiên cứu sáng tạo cấp cao như suy luận toán học hoặc diễn giải bài báo khoa học
- Phát triển thuật toán và viết mã: Đạt hiệu năng hàng đầu trong các bài toán lập trình khó, nơi cần cấu trúc hóa vấn đề cùng xem xét độ phức tạp thời gian và trade-off
- Chứng minh hiệu năng tốt nhất về mã/kiến thức/suy luận so với các mô hình trước đó trên các benchmark mới nhất (ví dụ: LiveCodeBench V6, Humanity’s Last Exam)
Phát triển có trách nhiệm và an toàn của Gemini
- Gemini 2.5 Deep Think cho thấy sự an toàn nội dung và giọng điệu khách quan được cải thiện hơn so với mô hình Pro hiện tại trong các đánh giá an toàn
- Cùng với việc tăng độ phức tạp của nhiệm vụ, mức độ rủi ro cũng được đánh giá tăng cường; các đánh giá Frontier Safety và biện pháp ứng phó cần thiết đã được tăng cường
- Kết quả an toàn chi tiết có thể xem trong model card
Cách sử dụng Deep Think
- Người đăng ký Google AI Ultra có thể truy cập tính năng này trên ứng dụng Gemini bằng cách chọn 2.5 Pro trong menu thả xuống mô hình rồi bật Deep Think toggle trên thanh prompt, với số lần sử dụng được giới hạn theo ngày
- Tự động tích hợp với công cụ như chạy mã, Google Search, v.v., cho phép tạo ra câu trả lời dài hơn đáng kể
- Sắp tới sẽ có thêm các đợt kiểm thử dành cho Gemini API và doanh nghiệp
1 bình luận
Ý kiến Hacker News
Tôi đã thử agent Deep Think mới ra, nhưng vừa nhập được năm prompt thì đã chạm giới hạn sử dụng hằng ngày. Với mức giá $250 mỗi tháng mà dịch vụ như thế này thì khá thất vọng. Xét về khả năng cạnh tranh giá, nó thua xa o3-pro hay Grok 4 Heavy. Trong cộng đồng AI, tính năng này được chú ý như phần duy nhất có thể phần nào biện minh cho giá thuê bao Google Ultra. Nhưng Google lại cung cấp model tốt nhất miễn phí trên AI Studio, trong khi với người dùng Ultra thực sự trả tiền thì lại áp dụng chính sách tính phí kiểu này, thật sự khó hiểu. Về hiệu năng, khi tôi đưa vào một tình huống vấn đề kinh doanh khó, nó trả ra một giải pháp rõ ràng và thuyết phục, trùng với kết luận từ các cuộc họp nội bộ của chúng tôi. Nhưng cuối cùng o3 cũng đưa ra kết luận tương tự với giá rẻ hơn nhiều. Chỉ là báo cáo của o3 có cảm giác kém gọn gàng hơn. Có lẽ phải dùng thêm mới biết
Mọi người, đây là kết quả khi tôi prompt Gemini Deep Think rằng “hãy vẽ một ảnh SVG con bồ nông đang đi xe đạp” https://www.svgviewer.dev/s/5R5iTexQ Tôi làm trước cả Simon Willison!
Nếu muốn tự chạy thử, bạn có thể dùng LLM cli của simonw và plugin llm-consortiumƯu điểm 1: có thể tự do phối hợp nhiều model với nhau. Có thể cấu hình theo tổ hợp mình muốn bất kể phòng lab nàoƯu điểm 2: dùng plugin llm-model-gateway để nối vào app hay công cụ cộng tác code của mình qua local API chỉ trong một lần https://x.com/karpathy/status/1870692546969735361
Có cả phần cài đặt, ví dụ lệnh, và cả ví dụ cho thấy còn có thể tạo consortium of consortium nữa.
https://GitHub.com/irthomasthomas/llm-consortium
llm serveĐây không phải model đã giành huy chương vàng tại IMO (Olympiad Toán học Quốc tế) vài tuần trước, nhưng là một biến thể rất gần https://x.com/OfficialLoganK/status/1951262261512659430Hiện vẫn chưa được cung cấp qua API
Cách tiếp cận lần này giống với Grok 4 Heavy: chạy song song nhiều agent “suy luận”, rồi so sánh câu trả lời với nhau để chọn ra đáp án tốt nhất, mất khoảng 30 phút. Kết quả thì rất tốt, nhưng xét công bằng thì benchmark nên so với Grok 4 Heavy hơn là Grok 4 (single agent, model nhanh hơn)
OpenAI đã nâng giá lên $200, Anthropic lên $100·$200, Gemini là $250, còn Grok tới $300. Chỉ OpenAI là nói “gần như không giới hạn”, và thực tế tôi chưa từng chạm trần ở gói ChatGPT Pro. Trong khi đó với Claude Max thì tôi đã nhiều lần đụng hạn mức. Nhưng tôi không hiểu vì sao những công ty này lại không công khai rõ các giới hạn
Dùng Gemini trong vài tháng gần đây khiến tôi có cảm giác nó ngày càng tệ hơn. Hallucination xảy ra quá thường xuyên, mà kể cả khi chỉ ra thì AI vẫn bướng bỉnh. Khó mà tin tưởng được
Có thông báo rằng nếu là người đăng ký Google AI Ultra thì từ hôm nay có thể dùng tính năng Deep Think (được cấp số prompt cố định) trong ứng dụng Gemini. Nhưng tôi muốn biết rõ hơn “bộ cố định” ở đây nghĩa là số lượng cố định, hay là loại prompt bị giới hạn sẵn
Khi dùng Gemini CLI để lên lịch, dù tôi đã nói rất rõ là đừng tự ý có những hành động bất ngờ nhiều lần và đã can thiệp, nó vẫn cứ tìm cách tự sửa đổi khiến kế hoạch bị rối