Stable Diffusion được giải thích bằng hình ảnh
(jalammar.github.io)Các thành phần của Stable Diffusion
- Bộ hiểu văn bản (Encoder) - CLIPText
- Trình tạo ảnh
- Bộ tạo thông tin hình ảnh - Unet + Scheduler
- Bộ giải mã hình ảnh - Autoencoder Decoder
Diffusion là gì?
- Diffusion hoạt động như thế nào
- Vẽ ảnh thông qua việc giảm nhiễu
- Tăng tốc: thực hiện Diffusion trên phiên bản đã được nén thay vì ảnh pixel
- Bộ mã hóa văn bản: Transformer Language Model
- Gửi thông tin văn bản vào quy trình tạo ảnh
Chưa có bình luận nào.