- SDXL Turbo đạt hiệu năng tối tân nhờ áp dụng kỹ thuật chưng cất (distillation) mới
- Giảm số bước tạo ảnh từ 50 bước xuống chỉ còn 1 bước, cho phép tạo ảnh đơn bước với chất lượng chưa từng có
- Trọng số mô hình và mã nguồn có thể tải từ Hugging Face theo giấy phép nghiên cứu phi thương mại
- Stability AI đang trình diễn bản demo beta tính năng tạo văn bản-thành-hình ảnh theo thời gian thực của SDXL Turbo trên nền tảng chỉnh sửa ảnh Clipdrop
Ưu điểm của Adversarial Diffusion Distillation
- SDXL Turbo dựa trên kỹ thuật chưng cất mới có tên Adversarial Diffusion Distillation (ADD)
- Thông qua ADD, mô hình có được các ưu điểm tương tự GAN (Generative Adversarial Networks) đồng thời có thể xuất ảnh chỉ trong một bước
- Tránh được các artifact hoặc hiện tượng mờ thường thấy ở những phương pháp chưng cất khác
So sánh hiệu năng với các mô hình khuếch tán khác
- Để chọn SDXL Turbo, nhiều biến thể mô hình đã được so sánh (StyleGAN-T++, OpenMUSE, IF-XL, SDXL, LCM-XL)
- Các đầu ra được tạo từ cùng một prompt được hiển thị ngẫu nhiên cho người đánh giá, và họ chọn đầu ra bám sát ý định của prompt nhất
- Các bài kiểm tra bổ sung về chất lượng hình ảnh cũng được thực hiện theo cùng phương pháp
- SDXL Turbo với một bước vượt qua cấu hình 4 bước của LCM-XL, và với 4 bước vượt qua cấu hình 50 bước của SDXL
- Kết quả này cho thấy SDXL Turbo vượt qua các mô hình đa bước tối tân với yêu cầu tính toán thấp hơn nhiều mà không phải hy sinh chất lượng hình ảnh
Trải nghiệm SDXL Turbo qua Clipdrop
- Để thử nghiệm khả năng của mô hình mới, có thể sử dụng bản demo beta tạo ảnh theo thời gian thực của SDXL Turbo trên nền tảng chỉnh sửa ảnh Clipdrop của Stability AI
- Tương thích với hầu hết các trình duyệt và hiện có thể dùng thử miễn phí
Ứng dụng thương mại
- Nếu muốn sử dụng mô hình này cho sản phẩm hoặc mục đích thương mại, cần liên hệ
1 bình luận
Nhanh thật đấy.