2 điểm bởi GN⁺ 2026-02-25 | 1 bình luận | Chia sẻ qua WhatsApp
  • Theo điều tra được công bố, một hệ thống watchlistdb dùng để giám sát và báo cáo dữ liệu định danh của người dùng đang vận hành trên hạ tầng có liên kết giữa OpenAI, chính phủ Mỹ và Persona
  • Từ mã nguồn có thể xác nhận hệ thống này thực hiện 269 quy trình xác minh, bao gồm nhận diện khuôn mặt, báo cáo tội phạm tài chính (SAR/STR), phân tích độ tương đồng với chính trị gia, truy vết địa chỉ tiền mã hóa
  • Nền tảng dành cho chính phủ của Persona (withpersona-gov.com) bao gồm khả năng gửi báo cáo trực tiếp tới FinCEN (Mạng lưới thực thi tội phạm tài chính thuộc Bộ Tài chính Mỹ)FINTRAC (Trung tâm phân tích giao dịch và báo cáo tài chính Canada)
  • Quy trình xác thực người dùng của OpenAI được thực hiện thông qua hạ tầng của Persona, trong đó ảnh khuôn mặt, ảnh giấy tờ tùy thân, dữ liệu sinh trắc học, thông tin vị trí được thu thập và lưu trữ
  • Cùng một codebase được dùng cho cả dịch vụ dân sự và hệ thống giám sát của chính phủ, cho thấy ranh giới giữa việc sử dụng dịch vụ AI và cơ chế giám sát nhà nước đang trở nên mờ nhạt

Tổng quan điều tra

  • Nhóm nghiên cứu đã tiến hành phân tích chỉ bằng các nguồn công khai như Shodan, nhật ký CT, DNS, HTTP header, source map công khai
  • Báo cáo nêu rõ không có hành vi truy cập trái phép hay tấn công nào, và mọi dữ liệu đều được thu thập từ các máy chủ công khai
  • Kết quả điều tra phát hiện các subdomain liên quan đến OpenAIopenai-watchlistdb.withpersona.comopenai-watchlistdb-testing.withpersona.com
    • Các máy chủ này đặt tại Google Cloud (Kansas City)vận hành độc lập, không được Cloudflare bảo vệ
    • Theo nhật ký minh bạch chứng chỉ, chúng đã hoạt động từ tháng 11/2023 trong hơn 2 năm

Hạ tầng Persona và liên kết với chính phủ

  • Persona là công ty xác minh danh tính có trụ sở tại San Francisco, các dịch vụ thông thường của họ vận hành phía sau Cloudflare
  • Tuy nhiên, instance watchlistdb dành cho OpenAI được vận hành độc lập trên máy chủ GCP riêng, được suy đoán là hạ tầng chuyên biệt nhằm tách biệt dữ liệu rủi ro cao
  • Tên miền withpersona-gov.com là bản triển khai dành cho chính phủ đã đạt chứng nhận FedRAMP (tháng 10/2025),
    • Bao gồm các tính năng báo cáo cho FinCEN, nhận diện khuôn mặt, widget dữ liệu tài chính, giám sát người dùng theo thời gian thực
    • hệ thống đăng nhập dựa trên Oktavùng được bảo vệ bởi Cloudflare Access

Triển khai ONYX và lộ mã nguồn

  • Tháng 2/2026, xuất hiện subdomain mới là onyx.withpersona-gov.com
    • Sử dụng cùng tên với công cụ giám sát Fivecast ONYX mà ICE (Cơ quan Thực thi Di trú và Hải quan Mỹ) sử dụng
    • Dù chưa xác nhận được liên hệ trực tiếp trong mã nguồn, sự tương đồng về tên gọi và hạ tầng đã được ghi nhận
  • Máy chủ này công khai cung cấp source map TypeScript dung lượng 53MB mà không cần xác thực
    • Mã nội bộ bao gồm các chức năng báo cáo SAR/STR, cơ sở dữ liệu khuôn mặt, so sánh khuôn mặt PEP (nhân vật có ảnh hưởng chính trị), giám sát địa chỉ tiền mã hóa
    • Có định nghĩa 269 mục xác minh13 loại danh sách theo dõi

Các chức năng chính và luồng dữ liệu

  • SAR (báo cáo hoạt động đáng ngờ): có thể gửi trực tiếp tới FinCEN, quản lý trạng thái như đã tiếp nhận, cảnh báo, từ chối
  • STR (báo cáo giao dịch đáng ngờ): gửi tới FINTRAC, có thể gắn thẻ các mật danh của cơ quan tình báo như Project SHADOW, LEGION
  • Cơ sở dữ liệu khuôn mặt: lưu tối đa 3 năm, có thể thêm selfie vào danh sách để tái xác minh
  • So sánh khuôn mặt PEP: phân tích độ tương đồng giữa selfie của người dùng với ảnh của chính trị gia và quan chức
  • Tích hợp Chainalysis: đánh giá mức độ rủi ro của địa chỉ tiền mã hóa và giám sát liên tục
  • Tích hợp OpenAI: tính năng AI Copilot (AskAI) trong nền tảng chính phủ, là trợ lý chat hỗ trợ công việc cho người vận hành

Vấn đề pháp lý và đạo đức

  • Đã xác nhận hạ tầng watchlist hoạt động từ trước cả chính sách xác minh danh tính của OpenAI (được áp dụng năm 2025)
  • Thời gian lưu dữ liệu sinh trắc học trong mã nguồn được ghi là 3 năm, khác với 1 năm mà OpenAI công bố
  • Làm dấy lên khả năng vi phạm BIPA của bang Illinois (luật bảo vệ dữ liệu sinh trắc học)
  • Chính sách chặn Ukraine cũng được đưa vào dù không phải đối tượng bị trừng phạt theo luật
  • Người dùng có thể bị chặn truy cập mà không được thông báo lý do từ chối hay quy trình khiếu nại

Kết luận

  • Đã xác nhận cùng một codebase của Persona được dùng cho cả dịch vụ AI dân sự (OpenAI) lẫn hệ thống giám sát và báo cáo tài chính của chính phủ
  • Mã nguồn bao gồm các chức năng ở cấp độ giám sát như báo cáo cho FinCEN và FINTRAC, nhận diện khuôn mặt, phân tích độ tương đồng với chính trị gia, truy vết tiền mã hóa
  • Dù chưa xác nhận được tuyến truyền dữ liệu trực tiếp, cấu trúc kỹ thuật này cho thấy quá trình sử dụng dịch vụ AI có thể được kết nối về mặt kỹ thuật với cơ chế giám sát nhà nước
  • Nhóm nghiên cứu yêu cầu Persona và OpenAI xác minh tuân thủ FedRAMP và đưa ra phản hồi chính thức cho 18 hạng mục, đồng thời cho biết sẽ tiếp tục công bố thêm trong thời gian tới

1 bình luận

 
GN⁺ 2026-02-25
Ý kiến trên Hacker News
  • Mang nguyên comment mình đã viết ở thread khác hôm nay sang đây. Phản hồi chính thức từ đội bảo mật Persona ở đây, và Rick đang trao đổi khá tích cực trên Twitter. Có thể xem thread liên quan khác ở đây
    • Có vẻ họ đã xử lý ứng phó khủng hoảng khá tốt với bài đăng đó
    • Nhưng link withpersona.com đó hiện trả về 404
  • Fivecast ONYX là một nền tảng giám sát dùng AI mà ICE và CBP đã chi hàng triệu USD để mua. Nó được cho là thu thập dữ liệu từ mạng xã hội và dark web để theo dõi thay đổi cảm xúc, điểm rủi ro, xu hướng bạo lực, v.v. Mình đã đoán trước kiểu công nghệ này sớm muộn cũng xuất hiện, giờ có khi sẽ đến ngày không có tài khoản mạng xã hội bị xem như tội lỗi
    • Theo giải thích chính thức của Persona, onyx chỉ là tên mã dự án nội bộ, lấy từ Pokémon Onyx, không liên quan đến Fivecast ONYX
    • Chắc chưa đến mức là tội, nhưng có thể bị trừ rất nặng trong điểm tín nhiệm xã hội
    • Thực tế thì gần như đã là vậy rồi. Khi xin visa Mỹ, nếu không nộp hồ sơ mạng xã hội công khai thì có thể bị từ chối. Nếu bạn tin chính phủ chi hàng tỷ USD cho các công nghệ này chỉ để thẩm tra đơn thuần thì quá ngây thơ
    • Khi qua biên giới, không có tài khoản mạng xã hội thì đã có thể bị xem là đáng ngờ rồi
    • Mình tò mò danh sách hơn 300 nền tảng đó gồm những gì
  • Chẳng phải đây đơn giản là quy trình KYC khi mở tài khoản thôi sao? Không rõ mình đang bỏ sót điều gì
    Có thể xem case khách hàng liên quan ở đây
  • Chia sẻ câu trả lời của Persona về yêu cầu dữ liệu. Tóm lại, trong đa số trường hợp Persona xử lý dữ liệu thay mặt khách hàng với vai trò "nhà cung cấp dịch vụ" (processor), và chỉ đóng vai trò "controller" đối với một số dịch vụ như LinkedIn, FoxCorp, Reusable Persona. Muốn thực hiện các quyền liên quan đến dữ liệu cá nhân thì phải liên hệ trực tiếp với công ty khách hàng đó. Có thể xem chi tiết tại thông báo quyền riêng tưtrang DSAR.
    TL;DR — “Bọn tôi không chịu trách nhiệm, hãy hỏi LinkedIn”
    • Nhưng với tư cách là cư dân California, khi mình yêu cầu dữ liệu liên quan đến LinkedIn theo luật Right to Know, mình lại nhận được câu trả lời hoàn toàn khác
    • Kiểu phản hồi này đúng là một màn lẩn tránh vô trách nhiệm, giống hệt lúc bạn muốn hủy đăng ký email quyên góp chính trị. Cuối cùng cùng một tổ chức lại đổi tên rồi gửi tiếp. Cần có luật đủ mạnh để chặn kiểu việc này, nhưng thực tế thì khó mà kỳ vọng
  • Trang cá nhân này thực sự duyên dáng và vui nhộn. Nội dung lại còn chắc tay nên càng thích hơn
    • Mình cũng vừa thử bấm nút âm lượng vật lý lần đầu sau một thời gian dài để tập trung đọc bài, cảm giác kỳ lạ là thấy tỉnh táo hẳn
  • Có thể xem lập trường của Persona ở đây
  • Mỗi lần công nghệ tiến lên, chúng ta lại nghe lời hứa về "tự do và tiện lợi", nhưng cuối cùng kết quả nhận về lại là điều ngược lại. Mình tự hỏi xã hội còn chịu đựng được khế ước xã hội bị phá vỡ này thêm bao lâu nữa
    • Mô hình xã hội hóa tổn thất và tư hữu hóa lợi nhuận giờ không còn chỉ là chuyện của tài chính nữa mà đã xâm lấn sang cả tự do của con người
    • Trong hoàn cảnh này, việc mỗi cá nhân có quyền tự quyết mới là điểm khởi đầu. Khi các tập đoàn lớn nói “chúng tôi sẽ tự cập nhật cho bạn”, thì dù muốn hay không cuối cùng bạn vẫn phải dùng công nghệ đó
    • Bạn đã từng đọc 1984 chưa? Hãy nhớ xem cuối cùng ai là người thắng
    • Bản chất của vụ việc lần này là một thất bại bảo mật rất cụ thể: file source map Vite dành cho môi trường phát triển nặng 53MB đã bị lộ trong hệ thống được chứng nhận FedRAMP. Không phải công nghệ phản bội chúng ta, mà câu hỏi thật sự là vì sao loại hạ tầng giám sát này lại được yêu cầu về mặt pháp lý, và vì sao quy trình thẩm định bảo mật lại bỏ sót chuyện này
    • Xã hội đã bắt đầu có dấu hiệu tan rã. Vì thế chủ nghĩa độc đoán dựa trên AI mới xuất hiện. Xã hội càng bất ổn thì con người càng dễ lầm tưởng rằng “độc đoán có khi còn tốt hơn”, nhưng cái giá đó tuyệt đối không đáng để trả
  • Mình thắc mắc vì sao lại có nhiều kỹ sư xây ra những thứ có hại cho xã hội đến vậy
    • Lý do đơn giản thôi. Vì kiếm được rất nhiều tiền
    • Phần lớn là do định luật Sinclair và kiểu tư duy tê liệt rằng "không có gì để giấu thì không sao cả"
    • Hoặc họ không nghĩ thứ mình làm là xấu, hoặc tin rằng đằng nào cũng sẽ có người khác làm, hoặc đơn giản là thiếu hiểu biết
    • Một số lãnh đạo xem Trung Quốc hoặc một đảng phái nào đó là mối đe dọa hiện sinh, nên tin rằng cần tăng cường giám sát và quân sự hóa. Nhân viên thường tiếp nhận nguyên xi kiểu tường thuật đó. Tất nhiên lý do gốc rễ vẫn là tiền
    • Cuối cùng thì đây là một cấu trúc trong đó cái ác được trả công cao hơn
  • Mình tò mò không biết chỉ vì nói “nhà lãnh đạo vĩ đại của nước Mỹ là đồ ngốc” mà mình đã bị đưa vào mấy danh sách giám sát rồi
    • Chắc cả vì nói “Israel đang tiến hành diệt chủng” nữa nên cũng có thể bị đưa vào danh sách
  • Mình tự hỏi người sống ở nước khác nhưng đã xác minh danh tính với Persona qua LinkedIn thì có thể làm gì
    • Họ nên tổ chức phong trào xóa dữ liệu ở từng nước, áp thuế lên các dịch vụ số của Mỹ, hoặc phát triển giải pháp công nghệ trong nước. Nếu không hành động thì sẽ chẳng có gì thay đổi. Đừng quên rằng sức mạnh của con người lớn hơn tiền bạc
    • Chia sẻ vài mẹo mình thấy trong bài blog này
      1. Yêu cầu dữ liệu: gửi email tới idv-privacy@withpersona.com hoặc privacy@withpersona.com (theo GDPR họ phải trả lời trong vòng 30 ngày)
      2. Yêu cầu xóa: nếu việc xác minh đã xong thì Persona không có lý do gì để giữ bản quét hộ chiếu hay dữ liệu khuôn mặt
      3. Có thể liên hệ DPO (dpo@withpersona.com) để phản đối việc dùng dữ liệu cho huấn luyện AI
      4. Cần nghĩ lại xem huy hiệu xanh có thực sự đáng giá ngang với việc giao nộp dữ liệu sinh trắc học vĩnh viễn hay không