- OpenAI đang củng cố mô hình nguồn gốc đa lớp bằng cách kết hợp tính tương thích C2PA, watermark SynthID và công cụ xác minh công khai để nhận diện nội dung do AI tạo ra
- C2PA cho phép metadata và chữ ký mật mã đi kèm bối cảnh tạo/chỉnh sửa của nội dung, nhưng có thể bị hỏng trong quá trình chuyển đổi
- SynthID của Google DeepMind bổ sung watermark vô hình cho các hình ảnh được tạo bởi ChatGPT, Codex và OpenAI API, nhằm bù đắp điểm yếu của metadata
- Bản xem trước của công cụ xác minh công khai giúp kiểm tra Content Credentials và SynthID trong ảnh được tải lên để hỗ trợ xác định liệu ảnh có được tạo bởi OpenAI hay không
- Chỉ một công nghệ đơn lẻ là chưa đủ; hệ sinh thái nguồn gốc chỉ mạnh hơn khi kết hợp tiêu chuẩn chung, watermark bền vững và xác minh công khai
Tăng cường cách tiếp cận về nguồn gốc nội dung
- OpenAI đang củng cố mô hình nguồn gốc đa lớp để xây dựng niềm tin trực tuyến, đồng thời muốn nâng cao khả năng nhận diện nội dung do AI tạo ra dựa trên tiêu chuẩn mở và hợp tác liên nền tảng
- Có ba thay đổi chính
- Hỗ trợ tính tương thích C2PA để các công cụ và nền tảng khác dễ nhận diện tín hiệu nguồn gốc hơn
- Hợp tác với Google để thêm watermark SynthID vào hình ảnh
- Cung cấp bản xem trước của công cụ xác minh công khai để mọi người có thể kiểm tra liệu hình ảnh có được tạo bởi OpenAI hay không
- Tín hiệu nguồn gốc cung cấp bối cảnh cần thiết để đánh giá nội dung đến từ đâu, được tạo hoặc chỉnh sửa như thế nào, và có khớp với tuyên bố đi kèm hay không
Hệ sinh thái niềm tin thông qua tính tương thích C2PA
- Từ năm 2024, OpenAI đã tham gia phát triển và triển khai các tiêu chuẩn nguồn gốc, đồng thời bắt đầu thêm Content Credentials vào các hình ảnh được tạo bởi DALL·E 3
- Sau đó, Content Credentials cũng được áp dụng cho ImageGen và Sora
- OpenAI đã tham gia ban điều hành của Coalition for Content Provenance and Authenticity (C2PA), một liên minh liên ngành thúc đẩy các tiêu chuẩn công nghệ mở cho nguồn gốc nội dung
- C2PA hoạt động bằng cách sử dụng metadata và chữ ký mật mã để giúp thông tin liên quan đến media di chuyển an toàn cùng với chính nội dung
- Thông tin này cung cấp bối cảnh cho các nhà báo đánh giá nguồn gốc, các nền tảng đưa ra quyết định liên quan đến tính toàn vẹn, và những người muốn hiểu nội dung trực tuyến
- Gần đây, OpenAI đã trở thành sản phẩm tạo sinh tương thích C2PA
- Tính tương thích C2PA là nền tảng để các nền tảng có thể đọc, bảo toàn và truyền tải thông tin nguồn gốc gắn với nội dung theo cách đáng tin cậy
- Thông tin nguồn gốc có ý nghĩa hơn khi được duy trì vượt ra ngoài nền tảng nơi nội dung ban đầu được tạo ra, và tuân thủ tính tương thích chính là yếu tố giúp điều đó thành hiện thực
Nguồn gốc hình ảnh đa lớp với SynthID
- Metadata C2PA là nền tảng giúp mang theo thông tin về nội dung đến từ đâu, được tạo hoặc chỉnh sửa như thế nào, và ai đã ký xác thực thông tin đó
- Metadata có thể bị gỡ bỏ, bị mất trong quá trình upload/download, hoặc bị hỏng do các biến đổi như đổi định dạng tệp, thay đổi kích thước hay chụp màn hình
- Để làm cho thông tin nguồn gốc vững chắc hơn, OpenAI đã đưa vào watermark vô hình thông qua SynthID của Google DeepMind
- Trước mắt, tính năng này được áp dụng cho các hình ảnh được tạo qua ChatGPT, Codex và OpenAI API
- SynthID hoạt động như một lớp watermark bổ sung để hỗ trợ cách tiếp cận dựa trên metadata C2PA
- Trước đây OpenAI cũng đã thử nghiệm các phương thức nguồn gốc và watermark trong môi trường triển khai thực tế
- Với Sora, công ty dùng watermark hiển thị
- Với Voice Engine, công ty dùng audio watermark
- Công ty tiếp tục thử nghiệm và nghiên cứu để xem độ chính xác và độ tin cậy có được duy trì theo thời gian hay không
- C2PA và SynthID bù đắp cho những điểm yếu khác nhau của nhau
- C2PA giúp đưa bối cảnh chi tiết vào nội dung, nhưng metadata có thể bị gỡ bỏ hoặc hư hỏng
- SynthID giúp giữ lại tín hiệu ngay cả khi metadata không còn được duy trì, và có thể tồn tại lâu hơn qua các biến đổi như chụp màn hình
- Metadata cung cấp nhiều thông tin hơn so với những gì chỉ watermark có thể cung cấp
- Khi dùng chung hai phương thức này, khả năng phục hồi của thông tin nguồn gốc nội dung sẽ mạnh hơn so với khi dùng riêng từng phương thức
Bản xem trước của công cụ xác minh công khai
- OpenAI cung cấp bản xem trước của công cụ xác minh công khai để hỗ trợ kiểm tra xem một hình ảnh có được tạo bởi ChatGPT, OpenAI API hay Codex hay không
- Công cụ này kiểm tra xem hình ảnh được tải lên có chứa các tín hiệu nguồn gốc như Content Credentials và SynthID hay không
- Mục tiêu là tích hợp nhiều tín hiệu để giúp người dùng xác minh và diễn giải thông tin nguồn gốc nội dung dễ dàng hơn
- Công cụ xác minh công khai có thể phát hiện ổn định watermark SynthID bắt nguồn từ OpenAI, đồng thời hiển thị metadata C2PA nếu tìm thấy
- Vì không có phương pháp phát hiện nào là hoàn hảo, công cụ sẽ không đưa ra kết luận dứt khoát khi việc phát hiện thất bại
- Ngay cả khi không phát hiện metadata hoặc watermark, điều đó cũng không khẳng định rằng hình ảnh đó không được tạo bằng công cụ của OpenAI
- Tín hiệu nguồn gốc trong một số trường hợp có thể đã bị loại bỏ
- Ở thời điểm phát hành, công cụ xác minh được giới hạn ở nội dung do OpenAI tạo ra
- Mục tiêu trong vài tháng tới là hỗ trợ các nỗ lực liên ngành nhằm cho phép xác minh trên toàn nền tảng
- Theo thời gian, công cụ cũng được kỳ vọng sẽ hỗ trợ nhiều loại nội dung hơn có thể bắt gặp trên mạng
Thách thức phía trước
- Chỉ một công nghệ nguồn gốc đơn lẻ là chưa đủ
- Một cách tiếp cận nguồn gốc mạnh mẽ cần kết hợp tiêu chuẩn chung, tín hiệu watermark có độ bền cao và xác minh công khai
- Thông qua hỗ trợ sẵn có cho Content Credentials, tính tương thích C2PA, việc đưa vào SynthID và bản xem trước của công cụ xác minh công khai, OpenAI muốn đóng góp cho một hệ sinh thái nguồn gốc có tính tương tác tốt hơn
1 bình luận
Ý kiến trên Hacker News
Nếu tạo ảnh AI với nền đen thì trên màn hình đủ tốt có thể nhìn thấy SynthID. Nó chỉ là một mẫu mờ lặp đi lặp lại, không có gì đặc biệt
Tôi đã gỡ nó khá hiệu quả bằng cách mask mỗi pixel thứ 2 rồi tái tạo các pixel bị thiếu, sau đó lệch đi 1 pixel và lại mask mỗi pixel thứ 2
Tôi dùng model có sẵn để điền pixel, nhưng trước khi chỉnh sửa thì xuất bản đồ độ sâu trước và giảm nhiễu để các pixel được tạo mới theo vùng mask khớp với nội dung gốc. Kết quả không hoàn hảo 100%, nhưng nếu dành thêm thời gian và dùng model được fine-tune cho mục đích này thì có vẻ có thể gỡ bất kỳ watermark AI nào mà không gặp vấn đề lớn
https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
Metadata hoặc SynthID chứa những thông tin gì? SynthID mã hóa được tối đa bao nhiêu bit?
Có thể làm kiểu nhãn thành phần dinh dưỡng cho nội dung tổng hợp không? Ví dụ 10% văn bản tổng hợp, 30% hình ảnh tổng hợp
Thực tại hôm nay của bạn được tổng hợp 15% rồi đấy (75% tập đoàn lớn, 25% neocloud open-weight)
Bản triển khai thực tế có lẽ sẽ khác khá nhiều
[0]:https://arxiv.org/html/2510.09263v1
Có vẻ SynthID đã bị phá hoàn toàn, nên việc watermark mới của OpenAI dường như vẫn chưa bị như vậy là điều đáng chú ý [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
Đây chỉ là trò làm màu vô nghĩa
Với tư cách người dùng công cụ để tạo ra thứ gì đó cho nhiều phương tiện, tôi sẽ đơn giản tránh các công cụ kiểu này nếu chúng chèn metadata tùy tiện mà tôi không chọn
Làm texture cho video game mà còn phải nhét thứ rác DRM kỳ quặc này vào sao? Photoshop tồn tại bao lâu rồi mà tại sao lại được ngoại lệ?
Photoshop không phải do Google hay OpenAI tạo ra, và rào cản để dùng Photoshop làm ảnh lừa đảo chân thực cao hơn AI rất nhiều. Các kỹ thuật phát hiện, dù không hoàn hảo, xem một hình có dùng chỉnh sửa ảnh truyền thống hay không cũng đã tồn tại
Chỉ khi Google hoặc OpenAI khẳng định quyền sở hữu trí tuệ với chính hình ảnh của họ thì SynthID mới là DRM, còn điều đó có hợp pháp hay không thì tôi không rõ
Tốt đấy. Ai cũng nói nó sẽ bị gỡ, nhưng tôi vẫn chưa thấy kho mã nào chứng minh được điều đó một cách tái lập
Tôi đã thử vào ngày đầu Nano Banana Pro ra mắt và nó có tác dụng. Giờ nó vẫn hoạt động với Nano Banana 2
Tôi đã không đăng ở đâu cả vì ngạo mạn nghĩ rằng công khai chuyện này sẽ làm Internet tệ hơn. Nhưng nếu tôi nghĩ ra ngay ngày đầu thì đương nhiên hàng triệu lập trình viên khác cũng nghĩ ra rồi, nên đó đúng là sự ngạo mạn thuần túy
Tuy nhiên sẽ xuất hiện artifact đặc trưng của model SD, và điều đó có thể bị phát hiện bằng cách khác. Hoặc nếu phóng thật to và soi kỹ thì cũng có thể thấy
Việc bài này lại nằm ngay cạnh bài kia thật chuẩn: https://news.ycombinator.com/item?id=48200569
Nó giống metadata của mp3 à?
Nếu chụp màn hình một ảnh AI thì nó vẫn bị nhận là ảnh AI sao? Tôi thắc mắc không biết nó được giấu trong chính hình ảnh hay chỉ là metadata
Ban đầu là xác minh bức ảnh có phải từ OpenAI hay không, rồi sau đó họ sẽ nhét cả dữ liệu thuê bao và thông tin vị trí vào
Cuối cùng họ sẽ nhận ra rằng chẳng ai muốn xem ảnh hay văn bản do AI tạo ra cả. Khi đó công cụ này sẽ thất bại với công chúng và chỉ còn hoạt động cho chính phủ
Mấy watermark kiểu này chẳng phải rất dễ bị xóa hoặc làm méo sao? Có vẻ chúng chỉ hữu ích chừng nào người ta còn ít phụ thuộc vào nó đến mức chưa đáng để lách qua
Nếu các nền tảng mạng xã hội bắt đầu cấm ảnh có watermark kiểu này thì có lẽ chỉ sau một đêm chúng sẽ bị gỡ sạch
Cho đến giờ, các cách tôi thấy chỉ là mấy mẹo lạ dùng độ trong suốt hoặc chồng ảnh gốc khi dùng tính năng chỉnh sửa, hoặc dùng model diffusion để tái tạo lại ảnh do NB sinh ra ở mức nhiễu thấp, nhưng như vậy thì ảnh gốc cũng bị thay đổi
https://github.com/aloshdenny/reverse-SynthID
Có vẻ kém hơn C2PA, một tiêu chuẩn công khai thực sự: https://contentauthenticity.org/