- Google Research và Đại học Cornell đã phát triển một phương pháp sinh mới để hoàn thiện ảnh
- RealFill hướng tới việc lấp đầy những phần bị thiếu của ảnh bằng nội dung đúng ra phải có ở đó, nhằm tạo ra hình ảnh chân thực hơn
- Mô hình được cá nhân hóa bằng cách sử dụng một số ảnh tham chiếu, vốn không nhất thiết phải khớp hoàn toàn với ảnh mục tiêu và có thể đa dạng về góc nhìn, điều kiện ánh sáng, khẩu độ máy ảnh hoặc phong cách hình ảnh
- RealFill vượt trội đáng kể so với các phương pháp hiện có trên một bộ benchmark mới về hoàn thiện ảnh, bao quát nhiều kịch bản đa dạng và đầy thách thức
- Quy trình này bao gồm việc tinh chỉnh một mô hình khuếch tán inpainting đã được huấn luyện trước trên các ảnh tham chiếu và ảnh mục tiêu, qua đó học được nội dung, ánh sáng và phong cách của cảnh trong ảnh đầu vào
- Mô hình sau khi được tinh chỉnh sẽ được dùng để lấp đầy vùng bị thiếu của ảnh mục tiêu thông qua quy trình lấy mẫu khuếch tán tiêu chuẩn
- RealFill tạo ra các hình ảnh chất lượng cao, trung thành với cảnh gốc và hấp dẫn về mặt thị giác ngay cả khi có khác biệt lớn giữa ảnh tham chiếu và ảnh mục tiêu
- Hạn chế của RealFill là quá trình tinh chỉnh dựa trên gradient tương đối chậm, cùng với khó khăn trong việc khôi phục cảnh 3D khi sự thay đổi góc nhìn giữa ảnh tham chiếu và ảnh mục tiêu là rất lớn
- RealFill cũng gặp khó khăn với các trường hợp thách thức ngay cả trên những mô hình nền tảng được huấn luyện trước như Stable Diffusion
1 bình luận
Ý kiến trên Hacker News