- Hỗ trợ hoán đổi khuôn mặt theo thời gian thực chỉ với một ảnh duy nhất bằng công nghệ AI tiên tiến (video deepfake một cú nhấp)
- Đa nền tảng: hỗ trợ CPU, NVIDIA CUDA, Apple Silicon (M1/M2)
- Tích hợp chức năng kiểm tra để ngăn xử lý nội dung không phù hợp và đảm bảo việc sử dụng hợp pháp, có đạo đức
- Mã nguồn mở Python
- Các bước sử dụng
- Thiết lập môi trường cần thiết (
python, pip, ffmpeg)
- Clone kho lưu trữ GitHub
- Tải các mô hình cần thiết (
GFPGANv1.4, inswapper_128_fp16.onnx)
- Cài đặt các phụ thuộc (dùng
venv: CUDA, CoreML, DirectML, OpenVINO)
- Chạy chương trình
- Chọn ảnh nguồn và đối tượng đích
- Bắt đầu xử lý hoán đổi khuôn mặt
Các tính năng chính của Deep Live Cam
- Hoán đổi khuôn mặt theo thời gian thực: có thể thay đổi khuôn mặt theo thời gian thực bằng một ảnh duy nhất, đồng thời cung cấp tính năng xem trước ngay lập tức
- Deepfake video một cú nhấp: có thể tạo video deepfake chất lượng cao nhanh chóng và dễ dàng chỉ với thao tác đơn giản
- Hỗ trợ đa nền tảng: có thể chạy phù hợp với nhiều cấu hình phần cứng khác nhau như CPU, NVIDIA CUDA, Apple Silicon
- Cơ chế bảo vệ cho việc sử dụng có đạo đức: đảm bảo sử dụng hợp pháp và có đạo đức thông qua chức năng kiểm tra tích hợp nhằm ngăn xử lý nội dung không phù hợp
- Hiệu năng được tối ưu hóa: tận dụng các thuật toán tối ưu hóa để tăng đáng kể tốc độ xử lý, đặc biệt trên GPU NVIDIA hỗ trợ CUDA
# Tóm tắt của GN⁺
- Deep Live Cam là công cụ AI tiên tiến cho hoán đổi khuôn mặt theo thời gian thực và deepfake video, có thể chạy trên nhiều nền tảng khác nhau
- Tích hợp cơ chế bảo vệ nhằm đảm bảo sử dụng có đạo đức và nhận được sự hỗ trợ liên tục từ cộng đồng mã nguồn mở
- Công cụ này hữu ích cho các dự án sáng tạo và sản xuất video, đặc biệt khi cần nhanh chóng đạt được kết quả hình ảnh chất lượng cao
- Các dự án khác cung cấp tính năng tương tự gồm có DeepFaceLab và FaceSwap
4 bình luận
Tôi đã tự triển khai thử, tuy không phải là không thể phân biệt được nhưng chỉ với một ảnh thật mà cũng làm được đến mức này sao...? Tôi có cảm giác người lớn tuổi thật sự rất dễ bị lừa, đúng là một thời đại khiến không biết phải tin vào điều gì nữa.
Nếu chỉ làm bằng một tấm ảnh mà ra được thế này thì kết quả thật sự rất ấn tượng. Có lẽ từ giờ chúng ta sẽ thật sự không thể tin hoàn toàn vào video nữa.
Ý kiến trên Hacker News
"Các biện pháp bảo vệ cho việc sử dụng có đạo đức" giúp ngăn xử lý nội dung không phù hợp
Chất lượng về mặt kỹ thuật rất đáng kinh ngạc
Dự án này dựa trên "GFPGAN v1.4" và "FaceSwap Extension - Automatic 1111 - Proof of Concept"
Dự án này có vẻ là một bản fork của roop đã bị ngừng phát triển, chủ yếu cải thiện UI
Ấn tượng về mặt kỹ thuật, nhưng khó tìm được trường hợp sử dụng tốt nào không liên quan đến tuyên truyền hay lừa đảo
Nếu thêm tăng cường giọng nói, tài khoản ngân hàng của mọi ông bà già đều có thể bị vét sạch
Người ta nghi ngờ liệu công nghệ này có trường hợp sử dụng hợp pháp nào hay không
"Chức năng kiểm tra tích hợp sẵn ngăn xử lý nội dung không phù hợp, từ đó đảm bảo việc sử dụng hợp pháp và có đạo đức"
Chúng ta đã đến thời điểm chỉ nên tin vào nội dung đa phương tiện được đối chiếu chéo từ các nguồn đáng tin cậy
Nhiều người cảm thấy thời điểm phát hành công cụ này là cực kỳ không phù hợp
"Các kỹ sư phần mềm chỉ mong khẩu súng không nhảy khỏi bàn rồi bắn người" haha