Việc gỡ mosaic khỏi video giờ đã dễ hơn bao giờ hết

(jeffgeerling.com)

20 điểm bởi GN⁺ 2025-04-16 | 3 bình luận | Chia sẻ qua WhatsApp

YouTuber Jeff Geerling đã thử nghiệm xem có thể khôi phục nội dung của hình ảnh thư mục bị pixel hóa hay không và treo thưởng 50 USD
Chưa đầy một ngày, 3 người tham gia đã xóa pixel thành công bằng các cách khác nhau
Người dùng GitHub KoKuToru đã công khai toàn bộ repository, bao gồm deep learning và kỹ thuật tích lũy khung hình thực sự được dùng
Làm mờ pixel trên video chuyển động nay rất dễ bị khôi phục nhờ sự phát triển của công nghệ AI
Kết luận: để bảo vệ thông tin nhạy cảm, các cách như che bằng màu đồng nhất an toàn hơn pixel hóa

Bối cảnh của thí nghiệm gỡ pixel khỏi video

Jeff Geerling đã hiển thị nội dung thư mục bị pixel hóa từ mốc 4:57 trong video YouTube của mình và chèn thông điệp kiểu “khôi phục được thì có thưởng”
Ông đưa ra điều kiện trả 50 USD nếu đoán đúng nội dung đã bị pixel hóa trong video
Chưa tới 24 giờ đã có 3 người thành công, mỗi người tiếp cận bằng cách hơi khác nhau

Họ đã khôi phục như thế nào?

Cả ba đều sẵn sàng chia sẻ quá trình khôi phục — đây là văn hóa khá phổ biến trong cộng đồng thích reverse engineering
Người dùng GitHub KoKuToru đã công khai toàn bộ repository

Thử nghiệm đầu tiên: cách brute force

Thu thập các vùng trùng khớp trong khung cửa sổ rồi tích lũy dữ liệu pixel
Dùng TensorFlow để gom thông tin từ nhiều khung hình và tạo ra một ảnh gần như có thể đọc được
Do phải chỉ định vùng thủ công nên kết quả hơi loang lổ

Thử nghiệm thứ hai: trích xuất khung hình tự động + chỉnh bằng GIMP

Dùng GIMP và ffmpeg để tự động phát hiện chính xác khung cửa sổ
Tận dụng nhiều khung hình hơn để thu được một ảnh hoàn toàn có thể đọc được

Có cách nào phòng tránh không?

Chỉ pixel hóa hoặc làm mờ là không phù hợp để bảo vệ thông tin nhạy cảm khi trong video có chuyển động
Đặc biệt, cùng với sự phát triển của AI và mạng nơ-ron, các kỹ thuật xử lý ngược kiểu này đang trở nên rất nhanh và rất chính xác
Ví dụ: có thể tách giọng nói sạch từ bản ghi âm có nhiều âm thanh trộn lẫn
Video càng chuyển động nhiều thì càng có nhiều điểm dữ liệu để phân tích, và độ chính xác cũng tăng lên
Tác giả cho rằng nếu người làm thí nghiệm không di chuyển cửa sổ Finder thì việc khôi phục có lẽ đã khó hơn

Vậy từ nay nên làm gì?

Nếu muốn che giấu dữ liệu nhạy cảm, nên dùng mặt nạ màu đồng nhất thay vì pixel hóa hay blur
Trực giác của con người có thể thấy blur tốt hơn, nhưng với AI thì không có khác biệt lớn
Kết luận, cách bảo mật tốt nhất là đừng đưa thông tin không được phép lộ vào video ngay từ đầu

Tài liệu tham khảo

GitHub tổng hợp toàn bộ quá trình khôi phục: KoKuToru’s de-pixelate repo

3 bình luận

bus710 2025-04-17

Mười mấy năm trước, cứ hễ tập đoàn lớn giao đề tài là các thạc sĩ tiến sĩ lại lao vào viết luận văn về deblurring... giờ thì gần như chỉ còn là chuyện bấm một cái.

crawler 2025-04-16

Xem video giải mã trên GitHub mà thấy thật sự sốc khủng khiếp.

GN⁺ 2025-04-16

Ý kiến trên Hacker News

Có ý kiến cho rằng vài năm trước, để làm việc này cần siêu máy tính và bằng tiến sĩ
- Thực ra không phải vậy. Ngay cả 20 năm trước cũng đã làm được trên laptop phổ thông
- Điều cần thiết là khả năng tái tạo việc sinh ảnh và điều kiện bị pixel hóa/làm mờ
- Nếu bán kính pixel chỉ bao gồm 4 ký tự, thì trước tiên chỉ cần tìm 4 ký tự đó
- Có thể xem pixel hóa như một hàm băm tệ, và rất dễ tìm được ảnh tiền ảnh
- Không cần motion, AI hay machine learning
- Phần khó là tái tạo môi trường, và AI cho phép bỏ qua công sức đó
Nhớ là 10 năm trước một đồng nghiệp đã làm việc tương tự cho một bản demo kỹ thuật thú vị
- Anh ấy quay video khi đi ngang qua một cánh cửa văn phòng mở hé
- Từ "khe hở di chuyển", anh ấy tái dựng lại toàn bộ hình ảnh của văn phòng
- Mỗi khi ở trong buồng vệ sinh công cộng lại nhớ đến chuyện đó
Cách kiểm duyệt ảnh chụp màn hình trên Windows-98
- Mở ảnh chụp màn hình trong MS-Paint
- Chọn màu 1 và màu 2 là màu đen
- Dùng công cụ chọn hình chữ nhật để chọn phần văn bản cần kiểm duyệt
- Nhấn phím DEL để biến hình chữ nhật thành màu đen
- Lưu ảnh chụp màn hình
- AI vẫn chưa tìm ra cách giải mã màu đen
Có ý kiến cho rằng nếu cửa sổ Finder không di chuyển thì cách này đã không hoạt động
- Nếu cần che dữ liệu nhạy cảm, tôi sẽ dùng mặt nạ màu thuần thay vì blur hoặc pixel hóa
- Khi cửa sổ di chuyển, đừng pixel hóa trên một lưới cố định
- Có thể pixel hóa một lần rồi chồng lên bằng ảnh chụp màn hình cố định để nhìn đẹp hơn
- Sẽ tốt nếu các công cụ chỉnh sửa video có sẵn tính năng xáo trộn pixel hóa
Những kỹ thuật như vậy đã được dùng từ lâu trong các lĩnh vực như thiên văn học
- Việc tái dựng vật thể từ ảnh mờ được dùng rộng rãi trong thiên văn học và ảnh sinh y học
- Nếu giả định độ mờ là bất biến theo không gian, làm mờ ảnh được định nghĩa là phép chập 2 chiều giữa ảnh thực và hàm phân tán điểm
- Chuyển sang bài toán khử chập mù đa khung hình để giảm số lượng ẩn số
Bộ xáo trộn Bell Labs A-3 dùng đảo dải tần và chuyển vị theo thời gian thực, nhưng thất bại trên thị trường thương mại
- Trong Thế chiến II, SIGSALY là hệ thống đầu tiên an toàn theo tiêu chuẩn hiện đại
- Nó sử dụng các cặp đĩa phonographic one-time được đồng bộ hóa
Video "Thank you" của Lockpicking Lawyer đã bị làm mờ nhưng không thực sự chặn thông tin
- Việc khôi phục dữ liệu lỗi từ đầu vào cửa sổ đã khả thi từ hơn 50 năm trước
- Đây là cách rẻ để chuyển chi phí từ cải tiến vật lý sang cải tiến tính toán
Có lời khuyên từ chuyên gia rằng nếu muốn kiểm duyệt thì hãy loại bỏ thông tin
Có người thắc mắc liệu việc thêm nhiễu ngẫu nhiên vào phiên bản pixel hóa có thể khiến phương pháp này không còn dùng được hay không
Có đề xuất thử "AV-8500 Special" của Nhật Bản từ thập niên 90