6 điểm bởi arxivgpt 2024-09-06 | 1 bình luận | Chia sẻ qua WhatsApp

Tiễn biệt một sự hiện diện mình yêu thương luôn mang đến cho bất kỳ ai cảm giác mất mát lớn lao và nỗi buồn nhói lòng.

Đặc biệt, nếu đối tượng ấy đã rời đi trên hành trình vĩnh viễn không thể gặp lại, thì cảm giác đó lại càng sâu sắc hơn.

Đó là chuyện chỉ mới diễn ra cách đây vài ngày.

Chú mèo cưng 'Eric' (biệt danh 'Eric Go'), người đã là một thành viên trong gia đình suốt hơn 10 năm, đã nói lời chia tay mà tôi hoàn toàn không thể tưởng tượng nổi, chứ đừng nói đến việc chuẩn bị tâm lý.

Vì gia đình và bản thân tôi đang chìm trong đau buồn, tôi đã nghĩ rằng mình muốn hồi tưởng về 'Eric' và tạo ra một cảm giác chân thực như thể em ấy vẫn luôn ở bên chúng tôi; tôi quyết định dùng 'AI' để tìm một cách giúp 'Eric' có thể mãi mãi ở cùng gia đình mình.

Trước hết, ở bước đầu tiên, tôi quyết định sử dụng những bức ảnh chụp 'Eric'.

Mục tiêu của giai đoạn đầu là để bất kỳ ai trong gia đình, mỗi khi nhớ Eric, đều có thể gặp lại em qua 'ảnh và video'.

Nói cách khác, trước tiên tôi cho AI học từ những bức ảnh chụp 'Eric' khi còn sống.

Sau đó, mỗi khi muốn gặp lại 'Eric', tôi nhập cho AI bằng văn bản hoặc giọng nói. Theo kiểu như: "Hãy cho tôi thấy hình ảnh một chú mèo (giữ nguyên dáng vẻ của 'Eric' khi còn sống) đang ở bãi biển Hawaii, đeo kính râm và hoa trang trí, với vẻ mặt hạnh phúc khi giơ dòng chữ 'Bố yêu con'."

Rồi chỉ ít lâu sau, AI sẽ tạo ra hình ảnh hoặc video về 'Eric' đúng như khi còn sống, theo đúng nội dung tôi mong muốn, và hiển thị cho tôi xem.

Để làm điều này, tôi đã xây dựng một số quy trình, khâu chuẩn bị (phát triển) và chiến lược.

Xin nói thêm, vì bản thân tôi có năng lực phát triển AI chuyên sâu và sở hữu nhiều GPU NVIDIA H100, nên đây là một thử thách và thí nghiệm hoàn toàn khả thi.

  1. Trước tiên, tôi chọn lọc khoảng 45 bức ảnh chụp 'Eric'.

  2. Để tăng chất lượng huấn luyện, tôi đã phát triển một quy trình tiền xử lý tự động và áp dụng nó.

Mục đích là để làm cho "đối tượng" rõ nét và rành mạch hơn, đồng thời nâng cao hiệu quả huấn luyện có giám sát cho AI.

Một trong các bước đó là tự động tách riêng "đối tượng" (con mèo) khỏi 'ảnh gốc' (có bao gồm nền), rồi thực hiện tiền xử lý như scale-up.

  1. Sau khi hoàn tất tiền xử lý, tôi tiến hành huấn luyện 45 bức ảnh bằng phương pháp LoRA.

Việc huấn luyện được thực hiện theo cấu hình mặc định, và mất khoảng 2 tiếng nếu tính theo GPU A100.

  1. Quá trình huấn luyện đã diễn ra, và sau khi hoàn tất, một 'mô hình' chuyên dụng cho 'Eric' đã được đăng ký trên 'Hugging Face'.

  2. Giờ đây, tôi kết nối mô hình đã huấn luyện với mô hình FLUX để chuẩn bị tạo ảnh với chất lượng tốt nhất.

Tôi đã lập trình để mô hình FLUX cơ bản có thể nhận prompt tiếng Hàn, và giờ có thể kiểm tra kết quả đã huấn luyện.

Kết quả giống hệt dáng vẻ của em ấy khi còn sống, đến mức đáng kinh ngạc.

Nhìn cả gia đình trầm trồ, thấy vừa kỳ diệu vừa thích thú trước kết quả này, tôi cảm thấy rất mãn nguyện.

Và tôi hy vọng việc công khai lại quá trình này như một bản ghi chép sẽ còn ở lại và có thể giúp ích cho ai đó.

Nếu ai đó cũng muốn làm điều tương tự cho mèo cưng hay chó cưng của mình, hãy cứ nhắn cho tôi bất cứ lúc nào, tôi rất sẵn lòng giúp đỡ.

1 bình luận

 
arxivgpt 2024-09-06

Thông tin chi tiết hơn và hình ảnh mình đã đăng trên Brunch.
Tham khảo: https://brunch.co.kr/@seawolf/16