- Google công bố tính năng tạo hình ảnh thông qua mô hình Gemini 2.0 Flash ở dạng bản xem trước dành cho nhà phát triển
- Có thể tạo, chỉnh sửa và biên tập từng phần hình ảnh bằng lệnh dựa trên văn bản, đồng thời chất lượng hình ảnh và khả năng hiển thị văn bản cũng được cải thiện
- Giới thiệu nhiều trường hợp sử dụng như reskin sản phẩm, tạo SKU, chỉnh sửa cộng tác theo thời gian thực
- Có thể thử ngay qua [Google AI Studio] và [Vertex AI], đồng thời giới hạn sử dụng API cũng được nâng lên
Công bố bản xem trước tính năng tạo hình ảnh của Gemini 2.0 Flash
- Dựa trên phản hồi từ các nhà phát triển, Google cung cấp tính năng tạo hình ảnh thông qua mô hình Gemini 2.0 Flash dưới dạng bản xem trước
- Người dùng có thể sử dụng qua Google AI Studio hoặc Vertex AI
Các cải tiến chính
- Cải thiện chất lượng hình ảnh (so với phiên bản thử nghiệm trước đó)
- Tăng độ chính xác khi hiển thị văn bản
- Giảm tỷ lệ bị bộ lọc chặn
Ví dụ về các tính năng tạo hình ảnh có thể áp dụng
- Đổi nền cho ảnh sản phẩm: có thể tái dựng ảnh sản phẩm hiện có với nhiều phông nền và môi trường khác nhau
- Chỉnh sửa cộng tác thời gian thực: trong ứng dụng Gemini Co-Drawing có hỗ trợ chỉnh sửa hình ảnh thời gian thực cho nhiều người dùng
- Chỉnh sửa hội thoại chỉ một phần của hình ảnh: có thể chỉnh sửa chỉ vùng cụ thể bằng lệnh hội thoại mà không thay đổi toàn bộ
- Tạo SKU sản phẩm động: kết hợp hình ảnh và văn bản để tự động tạo biến thể sản phẩm mới (màu sắc, nhãn, v.v.)
- Cộng tác lên ý tưởng cùng Gemini: thông qua tổ hợp văn bản + hình ảnh để hiện thực hóa nhiều kịch bản như nấu ăn, sản phẩm, lập kế hoạch và hơn thế nữa
Ví dụ sử dụng API (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
Kế hoạch sắp tới
- Google dự kiến sẽ tiếp tục mở rộng tính năng thông qua chất lượng cao hơn, bổ sung tính năng, tăng tốc độ và cải thiện gói giá
- Xem tài liệu chi tiết tại hướng dẫn tạo hình ảnh với Gemini API
1 bình luận
Ý kiến Hacker News