Ra mắt Stable Diffusion 2.0

xguru · 2022-11-24T12:35:40+09:00

SD v1 đã làm thay đổi cục diện của các mô hình AI mã nguồn mở SD v2 huấn luyện mô hình text-to-image bằng OpenCLIP, bộ mã hóa văn bản mới, giúp cải thiện mạnh chất lượng hình ảnh so với v1 Có thể tạo ảnh 512x512, 768x768 Được huấn luyện bằng tập con có tính thẩm mỹ của bộ dữ liệu LAION-5B (đồng thời loại trừ nội dung người lớn bằng bộ lọc NSFW) Tích hợp sẵn mô hình Upscaler Diffusion để tăng độ phân giải hình ảnh lên 4 lần Có nghĩa là có thể upscale ảnh 128x128 lên 512x512 Tức là SD v2 giờ đây có thể tạo ảnh ở độ phân giải từ 2048x2048 trở lên Mô hình Depth-to-Image Diffusion: depth2img Mở rộng tính năng image-to-image hiện có sang những khả năng mới Suy luận depth của ảnh đầu vào, sau đó dùng cả văn bản và thông tin độ sâu để tạo ảnh mới Tức là có thể chỉ tạo khác đi ở những phần cụ thể theo độ sâu của hình ảnh Cải thiện mô hình Inpainting Diffusion Tương tự SD v1, được tối ưu để vẫn có thể chạy trong môi trường GPU đơn

(stability.ai)

14 điểm bởi xguru 2022-11-24 | 1 bình luận | Chia sẻ qua WhatsApp

SD v1 đã làm thay đổi cục diện của các mô hình AI mã nguồn mở
SD v2 huấn luyện mô hình text-to-image bằng OpenCLIP, bộ mã hóa văn bản mới, giúp cải thiện mạnh chất lượng hình ảnh so với v1
Có thể tạo ảnh 512x512, 768x768
Được huấn luyện bằng tập con có tính thẩm mỹ của bộ dữ liệu LAION-5B (đồng thời loại trừ nội dung người lớn bằng bộ lọc NSFW)
Tích hợp sẵn mô hình Upscaler Diffusion để tăng độ phân giải hình ảnh lên 4 lần
- Có nghĩa là có thể upscale ảnh 128x128 lên 512x512
- Tức là SD v2 giờ đây có thể tạo ảnh ở độ phân giải từ 2048x2048 trở lên
Mô hình Depth-to-Image Diffusion: depth2img
- Mở rộng tính năng image-to-image hiện có sang những khả năng mới
- Suy luận depth của ảnh đầu vào, sau đó dùng cả văn bản và thông tin độ sâu để tạo ảnh mới
- Tức là có thể chỉ tạo khác đi ở những phần cụ thể theo độ sâu của hình ảnh
Cải thiện mô hình Inpainting Diffusion
Tương tự SD v1, được tối ưu để vẫn có thể chạy trong môi trường GPU đơn

1 bình luận

laeyoung 2022-11-25

Bên tôi cũng đang gắn upscaler vào SD v1 để cung cấp (tạo ở 512 x 512 rồi nếu người dùng muốn thì upscale chiều ngang và chiều dọc lên gấp 4 lần), và thấy cách kết hợp đó nhanh hơn và tốt hơn so với việc tạo kích thước lớn bằng SD v1.

Ra mắt Stable Diffusion 2.0

Bài viết liên quan

1 bình luận