Gemma - mô hình mở tiên tiến nhất của Google
(blog.google)- Google tin tưởng vào việc tạo ra AI hữu ích cho mọi người và đã đóng góp nhiều đổi mới cho cộng đồng mở như Transformers, TensorFlow, BERT, T5, JAX, AlphaFold, AlphaCode, v.v.
- Gemma là một họ mô hình mở, nhẹ và tiên tiến hàng đầu, được xây dựng dựa trên cùng nghiên cứu và công nghệ đã được dùng để tạo ra các mô hình Gemini
- Được phát triển bởi Google DeepMind và các nhóm khác, lấy cảm hứng từ
gemma, từ tiếng Latin có nghĩa là “viên ngọc”
- Được phát triển bởi Google DeepMind và các nhóm khác, lấy cảm hứng từ
- Từ hôm nay, có sẵn trên toàn cầu, cùng với trọng số mô hình, các công cụ hỗ trợ đổi mới cho nhà phát triển, thúc đẩy cộng tác và hướng dẫn sử dụng có trách nhiệm các mô hình Gemma
- Chia sẻ các thành phần công nghệ và hạ tầng với Gemini, nên Gemma 2B và 7B đạt hiệu năng tốt nhất trong tầm kích thước khi so với các mô hình mở khác
- Có thể chạy trực tiếp trên laptop hoặc máy tính để bàn của nhà phát triển, vượt qua các mô hình lớn hơn nhiều trên những benchmark chính, đồng thời tuân thủ các tiêu chuẩn nghiêm ngặt để cung cấp đầu ra an toàn và có trách nhiệm
- Cung cấp toolchain cho suy luận và SFT (tinh chỉnh có giám sát) trên mọi framework lớn như JAX, PyTorch, TensorFlow thông qua Native Keras 3.0
- Có thể dễ dàng bắt đầu với Gemma nhờ tích hợp với notebook Colab và Kaggle cùng các công cụ phổ biến như Hugging Face, MaxText, NVIDIA NeMo và TensorRT-LLM
- Các mô hình Gemma đã được pretrain và instruction-tuned có thể được triển khai dễ dàng trên Vertex AI và Google Kubernetes Engine (GKE) để chạy trên notebook, workstation hoặc Google Cloud
- Đảm bảo hiệu năng hàng đầu ngành nhờ tối ưu hóa cho nhiều nền tảng phần cứng AI, bao gồm NVIDIA GPU và Google Cloud TPU
- Theo điều khoản sử dụng, cho phép sử dụng và phân phối thương mại cho mọi tổ chức ở mọi quy mô
Có trách nhiệm ngay từ khâu thiết kế
- Gemma được thiết kế với các nguyên tắc AI được ưu tiên hàng đầu, đồng thời sử dụng các kỹ thuật tự động để lọc thông tin cá nhân và dữ liệu nhạy cảm khác khỏi tập huấn luyện
- Ngoài ra, mô hình còn sử dụng rộng rãi học tăng cường từ phản hồi của con người (RLHF) cho các mô hình đã được tinh chỉnh theo chỉ dẫn để phù hợp với hành vi có trách nhiệm
- Đã thực hiện các đánh giá mạnh mẽ như red team thủ công, kiểm thử đối kháng tự động và đánh giá năng lực của mô hình đối với các hoạt động nguy hiểm để hiểu và giảm hồ sơ rủi ro của các mô hình Gemma
Tối ưu trên nhiều framework, công cụ và phần cứng
- Các mô hình Gemma có thể được tinh chỉnh trên dữ liệu riêng để phù hợp với yêu cầu ứng dụng cụ thể, đồng thời hỗ trợ nhiều công cụ và hệ thống khác nhau
- Công cụ đa framework: có thể sử dụng framework ưa thích như Keras 3.0, PyTorch native, JAX và Hugging Face Transformers. Cung cấp implementation tham chiếu
- Khả năng tương thích đa thiết bị: có thể chạy trên các thiết bị phổ biến, bao gồm laptop, desktop, IoT, di động và cloud
- Nền tảng phần cứng tiên tiến hàng đầu: thông qua hợp tác với NVIDIA, tối ưu cho NVIDIA GPU từ data center đến cloud và cả máy RTX AI PC cục bộ, bảo đảm hiệu năng hàng đầu ngành và tích hợp với công nghệ tiên tiến
- Tối ưu trên Google Cloud: sử dụng Vertex AI để cung cấp bộ công cụ MLOps toàn diện và nhiều tùy chọn tuning, đồng thời hỗ trợ triển khai một cú nhấp chuột với tối ưu hóa suy luận tích hợp sẵn
Credit miễn phí cho nghiên cứu và phát triển
- Gemma được xây dựng cho cộng đồng nhà phát triển và nhà nghiên cứu đang thúc đẩy đổi mới AI; bạn có thể bắt đầu làm việc ngay từ hôm nay với quyền truy cập miễn phí trên Kaggle, tầng miễn phí của notebook Colab và khoản credit $300 cho người dùng Google Cloud lần đầu
- Các nhà nghiên cứu có thể đăng ký tới $500,000 credit Google Cloud để tăng tốc các dự án của mình
2 bình luận
Giờ thì chỉ có OpenAI là vẫn đóng mà thôi.
Ý kiến trên Hacker News
d_model, khác với đa số mô hình thường chỉ gấp 4 lần.