Google đang chiến thắng trên mọi mặt trận AI

(thealgorithmicbridge.com)

15 điểm bởi GN⁺ 2025-04-13 | 8 bình luận | Chia sẻ qua WhatsApp

Google đang áp đảo các đối thủ về hiệu năng mô hình AI, năng lực cạnh tranh về giá và mức độ tích hợp vào sản phẩm, qua đó nắm quyền dẫn dắt trên toàn bộ lĩnh vực AI
Lấy Gemini 2.5 Pro làm trung tâm, Google đang giới thiệu nhiều công nghệ AI tạo sinh đa dạng như văn bản, hình ảnh, âm nhạc, video, giọng nói, tác nhân và nhanh chóng tích hợp chúng vào hệ sinh thái Google
Sở hữu hạ tầng đám mây, phần cứng chuyên dụng cho AI và cả smartphone, Google đang ở vị thế thuận lợi hơn nhiều so với OpenAI hay Anthropic để dẫn dắt kỷ nguyên AI

Sự hồi sinh của DeepMind và ưu thế toàn diện của Google trong AI

Tác giả đã là fan của DeepMind từ lâu và nhớ lại rằng AlphaGo và AlphaZero mới là những khoảnh khắc AI thực sự mê hoặc, hơn cả ChatGPT
Google lẽ ra đã có thể bứt lên đủ xa trước khi ChatGPT ra mắt, nhưng đã bỏ lỡ cơ hội vì quá thận trọng nhằm bảo vệ doanh thu quảng cáo tìm kiếm
Tuy nhiên, từ sau đó Google và DeepMind không lặp lại sai lầm, và hiện đang dẫn đầu trên hầu hết toàn bộ lĩnh vực AI

Hiệu năng chưa từng có của Gemini 2.5 Pro

Gemini 2.5 Pro Experimental đang đứng số 1 trên nhiều benchmark công khai và không công khai
- LMArena, GPQA Diamond, Humanity’s Last Exam, AIME (toán), Aider Polyglot (lập trình), Live Bench (đa dạng) v.v.
- Khả năng chơi Pokémon tốt hơn Claude Sonnet và cũng đang tăng hạng nhanh trên Minecraft Bench
- Cũng cho kết quả nổi bật trong viết sáng tạo và khả năng hiểu ngữ cảnh dài
Trong đánh giá của người dùng, Gemini 2.5 Pro cũng được xem là tốt nhất ngành
- Nhiều người dùng trên Reddit, X và các nền tảng khác đã chia sẻ trải nghiệm sử dụng thực tế để chứng minh ưu thế này
Nổi trội ở mọi mặt: tốc độ, giá và tính năng
- Nhanh, rẻ, và cung cấp cửa sổ ngữ cảnh 1 triệu token
- Dự kiến sẽ được tích hợp với bộ sản phẩm Google như Gmail, Docs, Maps v.v.

Mô hình nhẹ Gemini Flash và Gemma 3 mã nguồn mở

Gemini 2.5 Flash là mô hình gọn nhẹ, được tối ưu cho môi trường di động và edge
- Nhanh, rất rẻ, và cùng với các phiên bản Flash, Flash Lite, Flash Thinking trước đó tạo nên hiệu quả chi phí rất cao
Gemma 3 là mô hình mã nguồn mở của Google, có thể cạnh tranh với Llama 4 và DeepSeek-V3

Cân bằng hoàn hảo giữa giá và hiệu năng

Google đang chiếm lĩnh Pareto Frontier ở cả phân khúc mô hình hiệu năng cao lẫn chi phí thấp
- Các mô hình hiệu năng cao vẫn rất hiệu quả về chi phí, còn các mô hình giá rẻ cũng cho hiệu năng đủ mạnh

Ưu thế trên mọi mảng của AI tạo sinh

Ngoài mô hình văn bản, Gemini còn đạt đẳng cấp hàng đầu ở âm nhạc (Lyria), hình ảnh (Imagen 3), video (Veo 2), giọng nói (Chirp 3)
- Veo 2 được đánh giá là có tính ứng dụng thực tế cao hơn Sora của OpenAI

Hệ thống tác nhân và công nghệ giao diện

Chế độ Deep Research của Gemini 2.5 Pro được cho là mạnh gấp đôi OpenAI
Nhiều dự án như Project Astra (tác nhân kiểu trợ lý), Project Mariner (giao diện máy tính) đang được triển khai
Cũng có kế hoạch hỗ trợ cả giao thức Agent2Agent và Model Context Protocol

Thành quả nghiên cứu liên tục và đóng góp học thuật

Google DeepMind liên tục công bố bài báo tại các hội nghị hàng đầu thế giới như Nature, ICLR, NeurIPS
Đồng thời tiếp cận AGI và AI công nghiệp với mức độ trách nhiệm cao

Hệ sinh thái Google và tích hợp AI

Google vừa là công ty AI, vừa là công ty phần mềm tiêu dùng, và có thể tích hợp AI vào toàn bộ danh mục sản phẩm
- AI dự kiến sẽ được đưa vào 7 sản phẩm có 2 tỷ người dùng hàng tháng như Search, YouTube, Android, Gmail, Chrome
- Khi Gemini được tích hợp trên toàn bộ hệ sinh thái Google, nó sẽ trở thành AI tốt nhất được cung cấp mặc định cho hàng tỷ người dùng

Năng lực cạnh tranh về hạ tầng đám mây và phần cứng

Thông qua Google Cloud, Google cho thuê chip phục vụ các mô hình AI, đồng thời cũng tự phát triển chip TPU (Ironwood v7)
- Microsoft hỗ trợ OpenAI, Amazon hỗ trợ Anthropic qua hạ tầng cloud, nhưng Google tự xử lý mọi thứ trong chính hệ sinh thái của mình
- Ở mảng phần cứng AI, Google cũng đang cạnh tranh với Nvidia

Bước vào cả thị trường smartphone

Google tích hợp sẵn Gemini trên Pixel 9, qua đó có thể cạnh tranh với Apple và Samsung
- Các tính năng AI như chia sẻ màn hình, điều khiển camera đã được triển khai thực tế
- Các thiết bị/wearable AI mà những công ty khác thử nghiệm thì đang thất bại

Kết luận: ưu thế mang tính quyết định của Google + DeepMind

Tác giả ngạc nhiên trước ưu thế áp đảo trên mọi mặt trận của Google đến mức thấy khó hiểu khi trước đây mình từng đặt kỳ vọng vào OpenAI, Anthropic và Meta
Dù vẫn sẽ theo dõi các đòn phản công từ đối thủ trong tương lai, ở thời điểm hiện tại Google rõ ràng là người chiến thắng chắc chắn trong cuộc chiến AI

8 bình luận

phoon 2025-04-14

Về mặt thông số thì không phải là không có các mô hình vượt GPT 4.5... nhưng chỉ cần thử dịch đơn thuần thôi cũng thấy khả năng cấu trúc câu của hai bên thậm chí còn không ở cùng đẳng cấp. (GPT thắng áp đảo)
Giờ có lẽ cũng cần bàn về việc nên thiết kế benchmark hay test set như thế nào.
Chưa kể dạo này cũng không hiếm những đánh giá cho rằng hiệu năng của chính LLM trong các tác vụ phổ thông đang thấp hơn kỳ vọng...

guitarhero 2025-04-14

"Tác giả từ lâu đã là một người hâm mộ DeepMind,"

smboy86 2025-04-13

Tôi cũng đã thử 2.5 một lúc, nhưng hmm.. cuối cùng vẫn thấy GPT tốt hơn thì phải; chắc là tùy từng người chăng

mssmss 2025-04-14

Giờ tôi cũng dùng Gemini nhiều hơn. Đó là một trải nghiệm cho thấy khoảng cách ngày càng nới rộng.

kandk 2025-04-14

Tôi cũng thấy GPT có vẻ tốt hơn..

3xplore 2025-04-14

Tôi thấy Gemini 2.5 đưa ra câu trả lời có chất lượng cao hơn hẳn so với GPT, Claude và Grok 3.
Đặc biệt là gần đây GPT quá chậm nên khá bất tiện khi sử dụng.

GN⁺ 2025-04-13

Ý kiến trên Hacker News

Với tư cách là cựu nhân viên OpenAI, nhiều nhân tài ML chủ chốt đã rời OpenAI để sang các startup khác. Ứng dụng ChatGPT là sản phẩm thành công chủ lực của OpenAI, nhưng doanh thu có thể thu được từ phí thuê bao là có giới hạn. Nhiều khả năng sắp tới sẽ có dịch vụ miễn phí, và quảng cáo sẽ trở thành lựa chọn chính để kiếm tiền. Google cảm thấy không thoải mái với chiến lược thu hút người dùng của OpenAI. Google cần nhanh chóng đưa đổi mới đến tay người dùng
Bài viết này không nhắc đến TPU. Hệ sinh thái JAX + TPU của Google cực kỳ xuất sắc. Google sở hữu giải pháp điện toán riêng, qua đó có lợi thế trong cạnh tranh. Các công ty AI phải trả lời câu hỏi: "Họ có thể làm điều gì mà nơi khác không làm được?". Lợi thế phần cứng của Google đưa ra một câu trả lời thực tế cho câu hỏi đó
Ý kiến về đơn vị dẫn đầu trong lĩnh vực ML thay đổi rất thường xuyên. Vài tháng trước người ta còn nghĩ Google đã thất bại, nhưng giờ OpenAI lại đang mất đà. Google hiện làm tốt, nhưng vài tháng nữa tình hình có thể hoàn toàn khác
Google có điểm yếu ở marketing, niềm tin, an toàn và thị phần. Tuy nhiên, mô hình Gemini Pro 2.5 thực sự rất xuất sắc
Có ý kiến cho rằng LLM có thể được quảng cáo tài trợ. Một kiểu "adsense" dựa trên LLM có thể hoạt động rất tinh vi và khéo léo. Quảng cáo có thể được chèn một cách tự nhiên vào giữa cuộc hội thoại
Người dùng Claude đã thử Gemini 2.5 và hài lòng nhờ hệ sinh thái tích hợp của Google. Google một lần nữa gặt hái thành công
Ngoài Gemini 2.5 Pro, Gemini 2.0 Flash cũng là một mô hình đa dụng. Nó rẻ, đa phương thức và cung cấp tốc độ đáng tin cậy. Nó cũng hỗ trợ API thời gian thực
Gemini 2.5 Pro tốt gấp đôi Deep Research của OpenAI. Deep Research của Google sâu hơn, đầy đủ hơn và sắc bén hơn
Gemini 2.5 Pro rất mạnh. Tuy nhiên, do vấn đề với web UI nên cũng đang dùng Claude Sonnet 3.7. Google đang tận dụng công cụ tìm kiếm lớn nhất và YouTube trong quá trình phát triển AI
Chừng nào Google còn tự trói mình vì kiểm duyệt thì tôi không thể dùng sản phẩm của họ. Gemini 2.5 Pro đã không thể trả lời một số câu hỏi nhất định. ChatGPT 4o thì đưa ra câu trả lời đúng

iolothebard 2025-04-22

Chắc như được kèm kiểu luyện gà đoán đề Hàn Quốc nên chỉ giỏi làm bài thi.
Đến lúc thực sự nói chuyện thì… ngơ ngơ.