30 điểm bởi GN⁺ 2024-08-11 | 4 bình luận | Chia sẻ qua WhatsApp
  • Hỗ trợ hoán đổi khuôn mặt theo thời gian thực chỉ với một ảnh duy nhất bằng công nghệ AI tiên tiến (video deepfake một cú nhấp)
  • Đa nền tảng: hỗ trợ CPU, NVIDIA CUDA, Apple Silicon (M1/M2)
  • Tích hợp chức năng kiểm tra để ngăn xử lý nội dung không phù hợp và đảm bảo việc sử dụng hợp pháp, có đạo đức
  • Mã nguồn mở Python
  • Các bước sử dụng
    1. Thiết lập môi trường cần thiết (python, pip, ffmpeg)
    2. Clone kho lưu trữ GitHub
    3. Tải các mô hình cần thiết (GFPGANv1.4, inswapper_128_fp16.onnx)
    4. Cài đặt các phụ thuộc (dùng venv: CUDA, CoreML, DirectML, OpenVINO)
    5. Chạy chương trình
    6. Chọn ảnh nguồn và đối tượng đích
    7. Bắt đầu xử lý hoán đổi khuôn mặt

Các tính năng chính của Deep Live Cam

  • Hoán đổi khuôn mặt theo thời gian thực: có thể thay đổi khuôn mặt theo thời gian thực bằng một ảnh duy nhất, đồng thời cung cấp tính năng xem trước ngay lập tức
  • Deepfake video một cú nhấp: có thể tạo video deepfake chất lượng cao nhanh chóng và dễ dàng chỉ với thao tác đơn giản
  • Hỗ trợ đa nền tảng: có thể chạy phù hợp với nhiều cấu hình phần cứng khác nhau như CPU, NVIDIA CUDA, Apple Silicon
  • Cơ chế bảo vệ cho việc sử dụng có đạo đức: đảm bảo sử dụng hợp pháp và có đạo đức thông qua chức năng kiểm tra tích hợp nhằm ngăn xử lý nội dung không phù hợp
  • Hiệu năng được tối ưu hóa: tận dụng các thuật toán tối ưu hóa để tăng đáng kể tốc độ xử lý, đặc biệt trên GPU NVIDIA hỗ trợ CUDA

# Tóm tắt của GN⁺

  • Deep Live Cam là công cụ AI tiên tiến cho hoán đổi khuôn mặt theo thời gian thực và deepfake video, có thể chạy trên nhiều nền tảng khác nhau
  • Tích hợp cơ chế bảo vệ nhằm đảm bảo sử dụng có đạo đức và nhận được sự hỗ trợ liên tục từ cộng đồng mã nguồn mở
  • Công cụ này hữu ích cho các dự án sáng tạo và sản xuất video, đặc biệt khi cần nhanh chóng đạt được kết quả hình ảnh chất lượng cao
  • Các dự án khác cung cấp tính năng tương tự gồm có DeepFaceLabFaceSwap

4 bình luận

 
dongwon 2024-08-13

Tôi đã tự triển khai thử, tuy không phải là không thể phân biệt được nhưng chỉ với một ảnh thật mà cũng làm được đến mức này sao...? Tôi có cảm giác người lớn tuổi thật sự rất dễ bị lừa, đúng là một thời đại khiến không biết phải tin vào điều gì nữa.

 
xguru 2024-08-12

Nếu chỉ làm bằng một tấm ảnh mà ra được thế này thì kết quả thật sự rất ấn tượng. Có lẽ từ giờ chúng ta sẽ thật sự không thể tin hoàn toàn vào video nữa.

 
GN⁺ 2024-08-11
Ý kiến trên Hacker News
  • "Các biện pháp bảo vệ cho việc sử dụng có đạo đức" giúp ngăn xử lý nội dung không phù hợp

    • Có các ví dụ bắt chước người nổi tiếng và chính trị gia (bao gồm cả JD Vance)
    • Định nghĩa về deepfake 'có đạo đức' khá mơ hồ
    • Người ta đặt câu hỏi vì sao lại chọn làm thứ này trong vô số thứ AI có thể tạo ra
  • Chất lượng về mặt kỹ thuật rất đáng kinh ngạc

    • Giờ đây gần như mọi script kiddie đều có thể deepfake khuôn mặt trong cuộc gọi video thời gian thực
    • Không còn có thể tin hoàn toàn vào những gì mắt thấy trong cuộc gọi video
    • Chúng ta đang sống trong một thời đại đáng suy ngẫm
  • Dự án này dựa trên "GFPGAN v1.4" và "FaceSwap Extension - Automatic 1111 - Proof of Concept"

    • Dự án GFPGAN dựa trên bài báo của Wang và cộng sự, "GFP-GAN: Towards Real-World Blind Face Restoration with Generative Facial Prior"
  • Dự án này có vẻ là một bản fork của roop đã bị ngừng phát triển, chủ yếu cải thiện UI

    • Một trong những nhà phát triển chính của roop đang phát triển facefusion, có hỗ trợ thay khuôn mặt webcam theo thời gian thực
  • Ấn tượng về mặt kỹ thuật, nhưng khó tìm được trường hợp sử dụng tốt nào không liên quan đến tuyên truyền hay lừa đảo

    • Ngay cả trên website cũng không nêu ra trường hợp sử dụng rõ ràng nào
  • Nếu thêm tăng cường giọng nói, tài khoản ngân hàng của mọi ông bà già đều có thể bị vét sạch

    • Cần cảnh báo ngay từ bây giờ
  • Người ta nghi ngờ liệu công nghệ này có trường hợp sử dụng hợp pháp nào hay không

    • Tò mò không biết khi hình dung sản phẩm này, họ nhắm tới persona/thị trường ngách theo ngành dọc nào
  • "Chức năng kiểm tra tích hợp sẵn ngăn xử lý nội dung không phù hợp, từ đó đảm bảo việc sử dụng hợp pháp và có đạo đức"

    • Kỹ sư phần mềm chỉ biết hy vọng khẩu súng sẽ không tự nhảy khỏi bàn rồi bắn ai đó
  • Chúng ta đã đến thời điểm chỉ nên tin vào nội dung đa phương tiện được đối chiếu chéo từ các nguồn đáng tin cậy

    • Không rõ liệu camera có thể thêm chữ ký số để cho biết video/ảnh là thật hay không
    • So với gắn nhãn ảnh/video do AI tạo, việc gắn nhãn ảnh/video không phải AI có vẻ khả thi hơn
  • Nhiều người cảm thấy thời điểm phát hành công cụ này là cực kỳ không phù hợp

    • Nó có thể phá hoại cuộc bầu cử Mỹ năm nay
    • Chỉ riêng việc xét đến tác động của công nghệ này lên bầu cử cũng đã là điều đáng lo
    • Có thể kéo theo hàng loạt vấn đề như nội dung khiêu dâm trẻ em, khủng bố, gây bất ổn chính phủ, nội chiến/thế chiến, v.v.
 
cosine20 2024-08-13

"Các kỹ sư phần mềm chỉ mong khẩu súng không nhảy khỏi bàn rồi bắn người" haha