OpenAI đưa watermark SynthID của Google vào ảnh AI cùng công cụ xác minh

(openai.com)

2 điểm bởi GN⁺ 2026-05-20 | 1 bình luận | Chia sẻ qua WhatsApp

OpenAI đang củng cố mô hình nguồn gốc đa lớp bằng cách kết hợp tính tương thích C2PA, watermark SynthID và công cụ xác minh công khai để nhận diện nội dung do AI tạo ra
C2PA cho phép metadata và chữ ký mật mã đi kèm bối cảnh tạo/chỉnh sửa của nội dung, nhưng có thể bị hỏng trong quá trình chuyển đổi
SynthID của Google DeepMind bổ sung watermark vô hình cho các hình ảnh được tạo bởi ChatGPT, Codex và OpenAI API, nhằm bù đắp điểm yếu của metadata
Bản xem trước của công cụ xác minh công khai giúp kiểm tra Content Credentials và SynthID trong ảnh được tải lên để hỗ trợ xác định liệu ảnh có được tạo bởi OpenAI hay không
Chỉ một công nghệ đơn lẻ là chưa đủ; hệ sinh thái nguồn gốc chỉ mạnh hơn khi kết hợp tiêu chuẩn chung, watermark bền vững và xác minh công khai

Tăng cường cách tiếp cận về nguồn gốc nội dung

OpenAI đang củng cố mô hình nguồn gốc đa lớp để xây dựng niềm tin trực tuyến, đồng thời muốn nâng cao khả năng nhận diện nội dung do AI tạo ra dựa trên tiêu chuẩn mở và hợp tác liên nền tảng
Có ba thay đổi chính
- Hỗ trợ tính tương thích C2PA để các công cụ và nền tảng khác dễ nhận diện tín hiệu nguồn gốc hơn
- Hợp tác với Google để thêm watermark SynthID vào hình ảnh
- Cung cấp bản xem trước của công cụ xác minh công khai để mọi người có thể kiểm tra liệu hình ảnh có được tạo bởi OpenAI hay không
Tín hiệu nguồn gốc cung cấp bối cảnh cần thiết để đánh giá nội dung đến từ đâu, được tạo hoặc chỉnh sửa như thế nào, và có khớp với tuyên bố đi kèm hay không

Hệ sinh thái niềm tin thông qua tính tương thích C2PA

Từ năm 2024, OpenAI đã tham gia phát triển và triển khai các tiêu chuẩn nguồn gốc, đồng thời bắt đầu thêm Content Credentials vào các hình ảnh được tạo bởi DALL·E 3
Sau đó, Content Credentials cũng được áp dụng cho ImageGen và Sora
OpenAI đã tham gia ban điều hành của Coalition for Content Provenance and Authenticity (C2PA), một liên minh liên ngành thúc đẩy các tiêu chuẩn công nghệ mở cho nguồn gốc nội dung
C2PA hoạt động bằng cách sử dụng metadata và chữ ký mật mã để giúp thông tin liên quan đến media di chuyển an toàn cùng với chính nội dung
Thông tin này cung cấp bối cảnh cho các nhà báo đánh giá nguồn gốc, các nền tảng đưa ra quyết định liên quan đến tính toàn vẹn, và những người muốn hiểu nội dung trực tuyến
Gần đây, OpenAI đã trở thành sản phẩm tạo sinh tương thích C2PA
Tính tương thích C2PA là nền tảng để các nền tảng có thể đọc, bảo toàn và truyền tải thông tin nguồn gốc gắn với nội dung theo cách đáng tin cậy
Thông tin nguồn gốc có ý nghĩa hơn khi được duy trì vượt ra ngoài nền tảng nơi nội dung ban đầu được tạo ra, và tuân thủ tính tương thích chính là yếu tố giúp điều đó thành hiện thực

Nguồn gốc hình ảnh đa lớp với SynthID

Metadata C2PA là nền tảng giúp mang theo thông tin về nội dung đến từ đâu, được tạo hoặc chỉnh sửa như thế nào, và ai đã ký xác thực thông tin đó
Metadata có thể bị gỡ bỏ, bị mất trong quá trình upload/download, hoặc bị hỏng do các biến đổi như đổi định dạng tệp, thay đổi kích thước hay chụp màn hình
Để làm cho thông tin nguồn gốc vững chắc hơn, OpenAI đã đưa vào watermark vô hình thông qua SynthID của Google DeepMind
Trước mắt, tính năng này được áp dụng cho các hình ảnh được tạo qua ChatGPT, Codex và OpenAI API
SynthID hoạt động như một lớp watermark bổ sung để hỗ trợ cách tiếp cận dựa trên metadata C2PA
Trước đây OpenAI cũng đã thử nghiệm các phương thức nguồn gốc và watermark trong môi trường triển khai thực tế
- Với Sora, công ty dùng watermark hiển thị
- Với Voice Engine, công ty dùng audio watermark
- Công ty tiếp tục thử nghiệm và nghiên cứu để xem độ chính xác và độ tin cậy có được duy trì theo thời gian hay không
C2PA và SynthID bù đắp cho những điểm yếu khác nhau của nhau
- C2PA giúp đưa bối cảnh chi tiết vào nội dung, nhưng metadata có thể bị gỡ bỏ hoặc hư hỏng
- SynthID giúp giữ lại tín hiệu ngay cả khi metadata không còn được duy trì, và có thể tồn tại lâu hơn qua các biến đổi như chụp màn hình
- Metadata cung cấp nhiều thông tin hơn so với những gì chỉ watermark có thể cung cấp
Khi dùng chung hai phương thức này, khả năng phục hồi của thông tin nguồn gốc nội dung sẽ mạnh hơn so với khi dùng riêng từng phương thức

Bản xem trước của công cụ xác minh công khai

OpenAI cung cấp bản xem trước của công cụ xác minh công khai để hỗ trợ kiểm tra xem một hình ảnh có được tạo bởi ChatGPT, OpenAI API hay Codex hay không
Công cụ này kiểm tra xem hình ảnh được tải lên có chứa các tín hiệu nguồn gốc như Content Credentials và SynthID hay không
Mục tiêu là tích hợp nhiều tín hiệu để giúp người dùng xác minh và diễn giải thông tin nguồn gốc nội dung dễ dàng hơn
Công cụ xác minh công khai có thể phát hiện ổn định watermark SynthID bắt nguồn từ OpenAI, đồng thời hiển thị metadata C2PA nếu tìm thấy
Vì không có phương pháp phát hiện nào là hoàn hảo, công cụ sẽ không đưa ra kết luận dứt khoát khi việc phát hiện thất bại
- Ngay cả khi không phát hiện metadata hoặc watermark, điều đó cũng không khẳng định rằng hình ảnh đó không được tạo bằng công cụ của OpenAI
- Tín hiệu nguồn gốc trong một số trường hợp có thể đã bị loại bỏ
Ở thời điểm phát hành, công cụ xác minh được giới hạn ở nội dung do OpenAI tạo ra
Mục tiêu trong vài tháng tới là hỗ trợ các nỗ lực liên ngành nhằm cho phép xác minh trên toàn nền tảng
Theo thời gian, công cụ cũng được kỳ vọng sẽ hỗ trợ nhiều loại nội dung hơn có thể bắt gặp trên mạng

Thách thức phía trước

Chỉ một công nghệ nguồn gốc đơn lẻ là chưa đủ
Một cách tiếp cận nguồn gốc mạnh mẽ cần kết hợp tiêu chuẩn chung, tín hiệu watermark có độ bền cao và xác minh công khai
Thông qua hỗ trợ sẵn có cho Content Credentials, tính tương thích C2PA, việc đưa vào SynthID và bản xem trước của công cụ xác minh công khai, OpenAI muốn đóng góp cho một hệ sinh thái nguồn gốc có tính tương tác tốt hơn

1 bình luận

GN⁺ 2026-05-20

Ý kiến trên Hacker News

Nếu tạo ảnh AI với nền đen thì trên màn hình đủ tốt có thể nhìn thấy SynthID. Nó chỉ là một mẫu mờ lặp đi lặp lại, không có gì đặc biệt
Tôi đã gỡ nó khá hiệu quả bằng cách mask mỗi pixel thứ 2 rồi tái tạo các pixel bị thiếu, sau đó lệch đi 1 pixel và lại mask mỗi pixel thứ 2
Tôi dùng model có sẵn để điền pixel, nhưng trước khi chỉnh sửa thì xuất bản đồ độ sâu trước và giảm nhiễu để các pixel được tạo mới theo vùng mask khớp với nội dung gốc. Kết quả không hoàn hảo 100%, nhưng nếu dành thêm thời gian và dùng model được fine-tune cho mục đích này thì có vẻ có thể gỡ bất kỳ watermark AI nào mà không gặp vấn đề lớn
- Khó mà tin rằng có thể gỡ được watermark chỉ chứa thông tin có/không như watermark 0,5 bit. Thứ nhìn thấy được có lẽ chỉ là mồi nhử mang tính chức năng
- Chỉ cần phóng to hoặc nén ảnh đi một chút là không được sao?
- Điều thú vị là với thêm thời gian và một model được fine-tune cho mục đích cụ thể thì có thể gỡ bất kỳ watermark AI nào mà không gặp vấn đề lớn. Dùng AI để đối đầu AI lúc nào cũng thú vị
- Chắc chắn có thể lách qua. Vài kỹ sư của chúng tôi cũng đã xử lý chuyện này từ lâu
  https://deepwalker.xyz/blog/bypassing-synthid-in-gemini-phot...
Metadata hoặc SynthID chứa những thông tin gì? SynthID mã hóa được tối đa bao nhiêu bit?
Có thể làm kiểu nhãn thành phần dinh dưỡng cho nội dung tổng hợp không? Ví dụ 10% văn bản tổng hợp, 30% hình ảnh tổng hợp
Thực tại hôm nay của bạn được tổng hợp 15% rồi đấy (75% tập đoàn lớn, 25% neocloud open-weight)
- Bài báo SynthID-Image tháng 10/2025[0] có vẻ là một encoder-decoder thử nghiệm việc kiểm tra cờ hoặc payload 136 bit trên ảnh 512x512, rồi xem độ bền của watermark sau nhiều phép biến đổi
  Bản triển khai thực tế có lẽ sẽ khác khá nhiều
  [0]:https://arxiv.org/html/2510.09263v1
- Cũng có thể nhúng ID người dùng hoặc dấu vân tay riêng cho từng cá nhân. Máy in đã có kiểu đó từ lâu, và giờ chuyện đó có lẽ cũng sẽ dễ dàng áp dụng cho mọi ảnh và hình mà người ta tạo ra
- Có lẽ không làm được vậy đâu. Nếu bạn cắt dán một phần tổng hợp vào ảnh gốc thì SynthID sẽ không thể biết được
Có vẻ SynthID đã bị phá hoàn toàn, nên việc watermark mới của OpenAI dường như vẫn chưa bị như vậy là điều đáng chú ý [1]
[1] https://github.com/wiltodelta/remove-ai-watermarks
Đây chỉ là trò làm màu vô nghĩa
Với tư cách người dùng công cụ để tạo ra thứ gì đó cho nhiều phương tiện, tôi sẽ đơn giản tránh các công cụ kiểu này nếu chúng chèn metadata tùy tiện mà tôi không chọn
Làm texture cho video game mà còn phải nhét thứ rác DRM kỳ quặc này vào sao? Photoshop tồn tại bao lâu rồi mà tại sao lại được ngoại lệ?
- Không hoàn hảo không có nghĩa là vô dụng. Tôi đã thấy bài đăng trên mạng nơi ai đó chạy một hình ảnh qua trình kiểm tra SynthID của Google và chứng minh nó là đồ giả
  Photoshop không phải do Google hay OpenAI tạo ra, và rào cản để dùng Photoshop làm ảnh lừa đảo chân thực cao hơn AI rất nhiều. Các kỹ thuật phát hiện, dù không hoàn hảo, xem một hình có dùng chỉnh sửa ảnh truyền thống hay không cũng đã tồn tại
- Tôi tin là ai cũng nghĩ ra được vài điểm đủ để phân biệt Photoshop với AI tạo sinh
- Nói chính xác thì DRM là quản lý quyền kỹ thuật số và liên quan đến sở hữu trí tuệ
  Chỉ khi Google hoặc OpenAI khẳng định quyền sở hữu trí tuệ với chính hình ảnh của họ thì SynthID mới là DRM, còn điều đó có hợp pháp hay không thì tôi không rõ
- Tham khảo: https://en.wikipedia.org/wiki/Printer_tracking_dots
- Sản lượng thông tin sai lệch tối đa về mặt lý thuyết mỗi phút hiện nay so với Photoshop năm 2021 là thế nào?
Tốt đấy. Ai cũng nói nó sẽ bị gỡ, nhưng tôi vẫn chưa thấy kho mã nào chứng minh được điều đó một cách tái lập
- Với Stable Diffusion, chỉ cần mức khử nhiễu 10~15% là xong
  Tôi đã thử vào ngày đầu Nano Banana Pro ra mắt và nó có tác dụng. Giờ nó vẫn hoạt động với Nano Banana 2
  Tôi đã không đăng ở đâu cả vì ngạo mạn nghĩ rằng công khai chuyện này sẽ làm Internet tệ hơn. Nhưng nếu tôi nghĩ ra ngay ngày đầu thì đương nhiên hàng triệu lập trình viên khác cũng nghĩ ra rồi, nên đó đúng là sự ngạo mạn thuần túy
  Tuy nhiên sẽ xuất hiện artifact đặc trưng của model SD, và điều đó có thể bị phát hiện bằng cách khác. Hoặc nếu phóng thật to và soi kỹ thì cũng có thể thấy
- Có lẽ ngay từ đầu dùng model khác còn dễ hơn nhiều
- Dù sẽ bị gỡ, nhiều người vẫn sẽ không làm vậy. Tôi thực sự đã thấy thông tin sai lệch có thể bị phát hiện bằng SynthID
Việc bài này lại nằm ngay cạnh bài kia thật chuẩn: https://news.ycombinator.com/item?id=48200569
Nó giống metadata của mp3 à?
Nếu chụp màn hình một ảnh AI thì nó vẫn bị nhận là ảnh AI sao? Tôi thắc mắc không biết nó được giấu trong chính hình ảnh hay chỉ là metadata
- Nó nằm trong chính hình ảnh và được thiết kế để vẫn tồn tại sau những thao tác như vậy
Ban đầu là xác minh bức ảnh có phải từ OpenAI hay không, rồi sau đó họ sẽ nhét cả dữ liệu thuê bao và thông tin vị trí vào
Cuối cùng họ sẽ nhận ra rằng chẳng ai muốn xem ảnh hay văn bản do AI tạo ra cả. Khi đó công cụ này sẽ thất bại với công chúng và chỉ còn hoạt động cho chính phủ
- Công dụng duy nhất của nội dung do AI tạo ra mà chân thực như ảnh có vẻ là để lừa dối. Video do AI tạo đã được dùng trong quảng cáo chính trị ở Mỹ rồi
Mấy watermark kiểu này chẳng phải rất dễ bị xóa hoặc làm méo sao? Có vẻ chúng chỉ hữu ích chừng nào người ta còn ít phụ thuộc vào nó đến mức chưa đáng để lách qua
Nếu các nền tảng mạng xã hội bắt đầu cấm ảnh có watermark kiểu này thì có lẽ chỉ sau một đêm chúng sẽ bị gỡ sạch
- Không. Nó rất bền trước các biến đổi dễ thực hiện. Nhưng tôi cũng không cho rằng nó là bất khả xâm phạm
- Theo tôi biết vẫn chưa có một kho GitHub nào thật sự xóa được watermark SynthID thật trên output Nano Banana 2/NBPro. Phần lớn vẫn chỉ là các dự án nghiên cứu chưa tạo ra kết quả
  Cho đến giờ, các cách tôi thấy chỉ là mấy mẹo lạ dùng độ trong suốt hoặc chồng ảnh gốc khi dùng tính năng chỉnh sửa, hoặc dùng model diffusion để tái tạo lại ảnh do NB sinh ra ở mức nhiễu thấp, nhưng như vậy thì ảnh gốc cũng bị thay đổi
- Cần định nghĩa thế nào là “dễ”. Có cách tiếp cận dựa trên phân tích phổ của ảnh, và bề ngoài có vẻ là nó hoạt động
  https://github.com/aloshdenny/reverse-SynthID
- Cái này đã được công bố vài năm trước và có vẻ vẫn chưa bị phá. Rồi một lúc nào đó nó cũng sẽ bị phá thôi, nhưng nếu phải chờ 1~2 năm sau khi làm deepfake mới có thể đăng lên Facebook thì như vậy có khi đã đủ rồi. Có khi chỉ cần trì hoãn một tháng cũng đã đủ
- Cách khiến AI dựng lại hình từ đầu dựa trên mô tả cực kỳ chi tiết có vẻ cũng sẽ hiệu quả
Có vẻ kém hơn C2PA, một tiêu chuẩn công khai thực sự: https://contentauthenticity.org/

OpenAI đưa watermark SynthID của Google vào ảnh AI cùng công cụ xác minh

Tăng cường cách tiếp cận về nguồn gốc nội dung

Hệ sinh thái niềm tin thông qua tính tương thích C2PA

Nguồn gốc hình ảnh đa lớp với SynthID

Bản xem trước của công cụ xác minh công khai

Thách thức phía trước

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News