Google công bố mô hình AI Gemini
(blog.google)- Gemini là mô hình AI đầu tiên đạt 90% trên MMLU, vượt qua các chuyên gia con người
- Là mô hình AI đa phương thức, Gemini cũng vượt GPT-4V và Whisper trong các benchmark đa phương thức về hình ảnh/video/âm thanh
- Được tối ưu theo kích thước với 3 phiên bản mô hình
- Ultra: mô hình lớn nhất và mạnh nhất cho các tác vụ phức tạp
- Pro: có thể mở rộng trên phạm vi tác vụ rộng
- Nano: mô hình hiệu quả nhất cho các tác vụ on-device
- Có thể hiểu, giải thích và tạo mã chất lượng cao bằng những ngôn ngữ lập trình được dùng rộng rãi nhất thế giới như Python, Java, C++, Go
- Đồng thời ra mắt AlphaCode 2 dành cho Competitive Programming sử dụng Gemini
- Gemini 1.0 được huấn luyện ở quy mô lớn trên hạ tầng tối ưu cho AI bằng TPU v4 và v5e
- Ổn định hơn, dễ mở rộng hơn và hiệu quả hơn
- Tập trung vào Responsibility và Safety
- Thực hiện các đánh giá an toàn toàn diện
- Gemini Pro có thể dùng ngay trong Google Bard
- Hiện khả dụng bằng tiếng Anh tại 170 quốc gia và sẽ sớm hỗ trợ thêm các modality khác cùng ngôn ngữ mới
- Sẽ đưa Gemini Nano lên Pixel 8 Pro
- Trong vài tháng tới, Google cũng sẽ áp dụng Gemini vào Search, Ads, Chrome và Duet AI
- Từ ngày 13 tháng 12, nhà phát triển và khách hàng doanh nghiệp có thể sử dụng Gemini API thông qua Google AI Studio và Google Cloud Vertex AI (chỉ Pro)
- Gemini Ultra cũng sẽ sớm khả dụng
- Google đang hoàn tất các đợt kiểm tra trust và safety trên diện rộng, bao gồm kiểm định red team từ các tổ chức bên ngoài đáng tin cậy, đồng thời tiếp tục tinh chỉnh mô hình bằng fine-tuning và reinforcement learning from human feedback (RLHF) trước khi phát hành rộng rãi
- Sau khi cung cấp Gemini Ultra cho một số khách hàng, nhà phát triển, đối tác và các chuyên gia về safety và responsibility để thử nghiệm ban đầu và nhận phản hồi, Google dự kiến sẽ mở cho nhà phát triển và khách hàng doanh nghiệp vào đầu năm sau
- Đầu năm sau, bắt đầu với Gemini Ultra, Google cũng dự kiến ra mắt Bard Advanced, một môi trường AI mới tiên tiến cho phép sử dụng các mô hình và tính năng tốt nhất
7 bình luận
Xem video thì tôi đã nghĩ: "Bard đã tệ như vậy mà giờ lại vượt qua hết rồi sao?"
Hóa ra đó là video dàn dựng. Thế này chẳng phải là lừa đảo sao..
https://www.tomshardware.com/news/google-gemini-ai-video-staged
Tôi nhớ có một tweet như thế này: "Có người nghĩ Google đang tụt lại trong mảng AI, nhưng họ đang ở một đẳng cấp khác theo cách của riêng họ".
Hôm nay cổ phiếu Google tăng khá mạnh.
Có vẻ như nano có thể dùng trên Pixel 8 Pro thôi.... https://blog.google/products/pixel/pixel-feature-drop-december-2023/
Trong phạm vi áp dụng thì chỉ có Voice Recorder không hỗ trợ tiếng Hàn và gboard phải opt-in riêng ở bản beta.
Vậy chẳng phải là vì thế nên họ không bán Pixel ở Hàn Quốc sao..? haha
Tôi vẫn còn giữ chiếc Pixel 1 đó nữa T_T
Cuối cùng cũng đã ra mắt. Nếu được áp dụng rộng rãi trên các sản phẩm của Google thì thật đáng mong đợi xem nó sẽ trông như thế nào.
Video thú vị nhất là Hands-on with Gemini: Interacting with multimodal AI.
Chỉ khoảng 6 phút thôi nên nhất định hãy xem thử một lần. Nếu AI đa phương thức tiếp tục phát triển, có lẽ JARVIS mà chúng ta từng thấy trong phim sẽ trở thành hiện thực.
GPT-4 Vision cũng đã rất ấn tượng, có cảm giác thời đại của Jarvis thực sự sắp đến rồi... +_+