5 điểm bởi GN⁺ 2026-02-22 | 2 bình luận | Chia sẻ qua WhatsApp
  • Quy trình xác minh danh tính của LinkedIn hoàn tất khi người dùng gửi hộ chiếu và ảnh khuôn mặt, nhưng dữ liệu thực tế được chuyển không phải cho LinkedIn mà cho công ty Mỹ Persona
  • Persona thu thập một lượng lớn dữ liệu cá nhân như ảnh hộ chiếu, dữ liệu sinh trắc học để nhận diện khuôn mặt, dữ liệu chip NFC, thông tin thiết bị và vị trí
  • Dữ liệu này được sử dụng để huấn luyện AI, với cơ sở pháp lý được nêu là “lợi ích hợp pháp (legitimate interest)”, nên có thể được xử lý mà không cần sự đồng ý rõ ràng
  • Trong 17 đơn vị xử lý phụ (subprocessor) của Persona, có 16 công ty Mỹ, và các công ty AI như OpenAI, Anthropic phân tích dữ liệu hộ chiếu và khuôn mặt
  • Theo CLOUD Act của Mỹ, ngay cả dữ liệu được lưu trên máy chủ tại châu Âu cũng có thể bị chính phủ Mỹ truy cập, nên việc bảo vệ dữ liệu cá nhân của người dùng châu Âu trên thực tế không được bảo đảm

Cấu trúc thực tế của quy trình xác minh LinkedIn

  • Khi nhấn nút Verify của LinkedIn, người dùng sẽ được chuyển hướng tới Persona Identities, Inc. (đặt tại San Francisco)
    • LinkedIn là khách hàng doanh nghiệp, còn người dùng trở thành đối tượng xử lý dữ liệu của Persona
    • Phần lớn người dùng gửi hộ chiếu và ảnh khuôn mặt mà không hề nhận thức được sự tồn tại của Persona

Dữ liệu Persona thu thập

  • Trong quá trình xác minh danh tính, Persona thu thập các thông tin sau
    • Tên, toàn bộ ảnh hộ chiếu, ảnh selfie thời gian thực, hình học khuôn mặt (dữ liệu sinh trắc học)
    • Dữ liệu chip NFC, số ID quốc gia, giới tính, ngày sinh, email, số điện thoại, địa chỉ
    • Địa chỉ IP, thông tin thiết bị·trình duyệt, ngôn ngữ, thông tin vị trí
  • Ngoài ra còn theo dõi cả “phát hiện do dự”, “phát hiện sao chép·dán” và các dữ liệu sinh trắc học hành vi (behavioral biometrics) khác

Đối chiếu chéo dữ liệu với bên thứ ba

  • Ngoài thông tin do người dùng cung cấp, Persona còn tiến hành đối chiếu chéo với cơ sở dữ liệu chính phủ, tổ chức tín dụng, nhà mạng, công ty tiện ích công cộng
    • Đây không chỉ là xác minh danh tính đơn thuần mà là mức tra cứu dữ liệu gần như một cuộc kiểm tra lý lịch

Sử dụng làm dữ liệu huấn luyện AI

  • Theo chính sách quyền riêng tư, ảnh hộ chiếu và ảnh selfie được tải lên sẽ được dùng để huấn luyện mô hình AI
    • Mục đích là cải thiện khả năng nhận diện hộ chiếu theo từng quốc gia và nâng cao dịch vụ
    • Cơ sở pháp lý là “lợi ích hợp pháp”, nên có thể xử lý mà không cần sự đồng ý rõ ràng của người dùng
    • Việc này có xâm phạm các quyền cơ bản theo GDPR hay không vẫn chưa rõ ràng

Các chủ thể chia sẻ và truy cập dữ liệu

  • Thông tin LinkedIn nhận được gồm tên, năm sinh, loại giấy tờ tùy thân, cơ quan cấp, kết quả xác minh và bản sao giấy tờ tùy thân đã làm mờ
  • Persona cũng chia sẻ dữ liệu với các bên sau
    • Nhà cung cấp dịch vụ và đối tác dữ liệu, các công ty liên kết, bên mua lại tiềm năng, cơ quan thực thi pháp luật
  • Danh sách 17 đơn vị xử lý phụ (subprocessor) bao gồm
    • Anthropic, OpenAI, Groqcloud (trích xuất·phân tích dữ liệu)
    • Các dịch vụ hạ tầng và cơ sở dữ liệu như AWS, Google Cloud, Snowflake, MongoDB
    • Các nhà cung cấp API thanh toán·liên lạc như Stripe, Twilio
  • Trong số 17 đơn vị này, 16 ở Mỹ, 1 ở Canada, và không có công ty nào trong EU

CLOUD Act và vấn đề chủ quyền dữ liệu

  • Persona vận hành các trung tâm dữ liệu tại Mỹ và Đức, nhưng vì là pháp nhân Mỹ nên thuộc phạm vi áp dụng của CLOUD Act
    • Tòa án Mỹ có thể truy cập dữ liệu được lưu trên máy chủ ở nước ngoài thông qua lệnh pháp lý
    • Chính sách của Persona nêu rõ “cung cấp dữ liệu khi có yêu cầu vì mục đích thực thi pháp luật·an ninh quốc gia”
    • Có thể kèm theo lệnh bịt miệng (gag order), nên người dùng có thể sẽ không được thông báo

Giới hạn của EU-US Data Privacy Framework

  • Persona có chứng nhận EU-US Data Privacy Framework (DPF)
    • Tuy nhiên đây là cơ chế thay thế cho Privacy Shield, và hiệu lực pháp lý dựa trên Executive Order
    • Nếu chính quyền thay đổi trong tương lai, khả năng bị rút lại vẫn tồn tại
    • Các tổ chức bảo vệ quyền riêng tư như noyb đã nộp đơn thách thức pháp lý

Rủi ro của dữ liệu sinh trắc học và ngoại lệ lưu trữ

  • Persona nêu rõ dữ liệu hình học khuôn mặt sẽ được xóa sau khi xác minh hoàn tất hoặc trong vòng 6 tháng
    • Tuy nhiên có ngoại lệ lưu trữ khi có yêu cầu pháp lý, nên theo lệnh của tòa án Mỹ có thể bị lưu giữ vô thời hạn
    • Dữ liệu sinh trắc học là định danh duy nhất không thể thay đổi, nên nếu bị rò rỉ thì không thể khôi phục

Trách nhiệm pháp lý và quyền của người dùng

  • Mức bồi thường thiệt hại của Persona bị giới hạn ở 50 USD
    • Tranh chấp chỉ có thể được xử lý bằng trọng tài cá nhân bắt buộc thông qua tổ chức trọng tài Mỹ (AAA)
    • Với người dùng EU, tài liệu ghi rõ áp dụng luật Ireland, nhưng do CLOUD Act được ưu tiên áp dụng, mức bảo vệ thực tế là rất yếu

Các biện pháp được đề xuất cho người dùng

  • Người dùng đã hoàn tất xác minh có thể thực hiện các việc sau
    • Yêu cầu truy cập dữ liệu: idv-privacy@withpersona.com
    • Yêu cầu xóa: yêu cầu xóa dữ liệu không cần thiết sau khi xác minh hoàn tất
    • Liên hệ DPO: có thể gửi phản đối về việc sử dụng cho huấn luyện AI tới dpo@withpersona.com
    • Cân nhắc lại việc xác minh: cần xem trọng bảo vệ dữ liệu sinh trắc học hơn một huy hiệu đơn giản

Kết luận

  • Xác minh danh tính của LinkedIn chỉ mất 3 phút, nhưng để hiểu luồng dữ liệu thực sự thì phải đọc 34 trang tài liệu pháp lý
  • Người dùng đang cung cấp hộ chiếu, khuôn mặt, dữ liệu sinh trắc học, hồ sơ tín dụng cho một công ty Mỹ, đồng thời
    phải đối mặt với khả năng huấn luyện AI·truy cập của chính phủ·lưu trữ theo ngoại lệ pháp lý
  • Dữ liệu của người dùng châu Âu trên thực tế đang nằm dưới hệ thống pháp luật Mỹ
  • Đây là một cấu trúc trong đó người dùng trao toàn bộ danh tính cá nhân chỉ để lấy một huy hiệu xanh đơn giản

2 bình luận

 
cherrycoder 2026-02-22

Có vẻ việc này cũng được tận dụng nhiều một cách khá bất ngờ trong các hoạt động phản gián nội địa ở Mỹ.

 
GN⁺ 2026-02-22
Ý kiến từ Hacker News
  • CEO của Persona đã trực tiếp giải thích trên LinkedIn
    Dữ liệu cá nhân không được dùng để huấn luyện AI, dữ liệu sinh trắc học sẽ bị xóa ngay sau khi xác minh danh tính, và phần dữ liệu còn lại sẽ tự động bị xóa trong vòng 30 ngày
    Trên thực tế, khi bộ phận pháp lý can thiệp thì tài liệu thường được soạn quá bao quát. Nó có thể trông u ám hơn nhiều so với thực tế, nên những lời giải thích như vậy vẫn có ý nghĩa trong việc bảo đảm tính minh bạch

    • Nếu những giải thích này không được phản ánh trong văn bản pháp lý thì tôi nghĩ chúng chẳng có ý nghĩa gì. Thay vì chỉ tin lời CEO, điều đó phải được xác nhận bằng tài liệu
    • Chính sách có ghi rõ là “có thể thay đổi bất cứ lúc nào”, vậy thì lời CEO có ích gì là điều đáng nghi. Trên thực tế họ cũng có thể chỉ soft delete rồi vẫn giữ lại dữ liệu
    • Có vẻ dùng “claiming that” sẽ đúng hơn là “pointing out”. Xét đến mối liên hệ với các công ty đã thu thập dữ liệu trái phép và dùng nó để huấn luyện mô hình, thật khó để tin tưởng
    • Việc bộ phận pháp lý dùng câu chữ quá bao quát cũng có thể là vì nội bộ có điều gì đó chưa chắc chắn, hoặc cố ý chừa lại dư địa để khai thác dữ liệu. Nếu thực sự muốn bảo vệ quyền riêng tư của người dùng thì phải ghi rõ trong văn bản pháp lý
    • Việc dữ liệu sinh trắc học được gửi lên máy chủ nghe khá lạ. Tôi thắc mắc vì sao họ không xử lý trên thiết bị (on-device processing). Có lẽ một cấu trúc chỉ gửi hash+salt như mật khẩu sẽ an toàn hơn
  • Trước đây tôi từng tạo một địa chỉ email riêng chỉ để đăng ký LinkedIn, và ngay khi xóa tài khoản thì spam email bắt đầu đổ về địa chỉ đó
    Tôi muốn tự làm thử nghiệm, nhưng họ đã đánh mất lòng tin rồi. Tôi tin rằng LinkedIn đã bán dữ liệu

    • Tôi thấy việc Mozilla tuyển CEO mà hồ sơ trực tuyến duy nhất lại là LinkedIn thật mỉa mai. Một tổ chức hô hào chống giám sát thì vì sao lại đưa ra lựa chọn như vậy?
    • LinkedIn có lịch sử bị hack quá nhiều. Cảm giác như họ muốn vắt kiệt dữ liệu của cả những người dùng đã rời đi
    • Tôi nghĩ LinkedIn về bản chất là một nền tảng thu thập thông tin. Việc Microsoft mua lại nó, giống như với Skype, cũng có vẻ cùng một logic
    • LinkedIn ngày xưa từng có quá khứ đầy vấn đề như quét email, tạo tài khoản giả, v.v.
    • LinkedIn về cơ bản là một nền tảng hồ sơ công khai. Thông tin nào muốn giữ riêng tư thì đừng đăng lên. Spam là điều khó tránh, và lọc email là phương án thực tế hơn
  • Khi tạo tài khoản mới, tôi đã bị ép xác minh danh tính. Tôi phải xác minh bằng hộ chiếu, nhưng sau đó khi kiểm tra dữ liệu cá nhân thì gần như chẳng có thông tin nào được cung cấp
    Cài đặt quảng cáo mặc định đều bật, và toàn bộ quá trình rất khó chịu.
    Vì là tài khoản dùng cho công ty nên tôi buộc phải làm, nhưng điều đó khiến tôi càng thấy cần có dịch vụ thay thế phi tập trung

    • Việc xác minh cũng bị ép buộc cả khi truy cập tài khoản hiện có. Muốn xóa tài khoản hoặc từ chối việc dùng nội dung cho AI thì lại phải nộp thêm thông tin, đúng là một cấu trúc đầy mâu thuẫn
    • Tôi hiểu việc cần xác minh danh tính vì vấn đề bot AI, nhưng phải có cách xây dựng niềm tin mà vẫn bảo vệ được quyền riêng tư. Câu trả lời trên LinkedIn của CEO Persona cũng đáng tham khảo
    • Lý do những dịch vụ như thế này có thể muốn làm gì thì làm là vì hiệu ứng mạng lưới. Người dùng bị trói vào đó nên khó rời đi, và đó chính là quyền lực
    • Việc Persona có liên hệ với Peter Thiel cũng đáng lo. Có nguy cơ nó bị kết hợp với giám sát của chính phủ
  • Tôi nghĩ việc xác minh danh tính qua Persona rốt cuộc cũng là góp phần làm giàu dữ liệu của chính phủ (enrichment)
    Các dịch vụ lớn như Coursera, Wealthsimple, Lime đã phụ thuộc vào nó nên rất khó tránh, nhưng vẫn cần bảo đảm pháp lý về việc sử dụng dữ liệu
    Những khu vực đang bàn về chủ quyền số như Canada hay châu Âu cần nuôi dưỡng các lựa chọn thay thế trong khu vực

    • Trên thực tế, ngay cả trong những thủ tục đời thường như xin việc, thuê nhà, visa, chữ ký điện tử cũng khó mà tránh được
    • Một cách mỉa mai, có người nói vị trí của các nền tảng KYC chỉ hợp ở “địa ngục”
  • Persona có vẻ không đủ năng lực đáng tin cậy để xử lý dữ liệu cá nhân ở quy mô lớn
    Bài blog liên quan: https://vmfunc.re/blog/persona

    • Cuộc trao đổi trên X (Twitter) giữa CEO và blogger cũng đáng xem. Theo đó đây không phải là vụ hack mà là rò rỉ source map phía frontend, khiến tên biến nội bộ bị lộ ra
    • Cũng có phản hồi rằng đây là một bài viết rất hay, mang lại cảm giác Internet thời xưa
    • Tuy vậy cũng có nhận xét kỹ thuật rằng trang này gây rò rỉ bộ nhớ trên Firefox
    • Cũng có cảnh báo rằng bấm nút “Continue” thì nhạc sẽ bất ngờ phát lên
  • Cấu trúc cốt lõi của các nền tảng như LinkedIn, Google, Facebook là bán người dùng như một món hàng
    Nếu ai đó trả tiền để nhắm mục tiêu vào bạn, thì số tiền đó cuối cùng cũng sẽ được thu lại từ chính bạn
    Tôi nghĩ kiểu cấu trúc này về lâu dài đã làm trầm trọng thêm bất bình đẳng kinh tế

    • Bài viết này quá ấn tượng nên tôi muốn trích dẫn khi giải thích tầm quan trọng của quyền riêng tư. Tôi cũng dùng dịch vụ của Google, nhưng luôn ý thức về mô hình kinh doanh của họ
    • LinkedIn thực ra cũng là một nền tảng bán sản phẩm trả phí. Vấn đề là chừng đó vẫn chưa đủ nên họ còn tận dụng thêm dữ liệu
    • Mọi người đều dùng vì nó “hay ho và miễn phí”, nhưng gần như chẳng ai thực sự chịu trách nhiệm cho hậu quả của điều đó
    • Cũng có trường hợp người dùng tham gia LinkedIn vì muốn trở thành đối tượng được nhắm tới. Cấu trúc doanh nghiệp tìm kiếm người tìm việc có thể là lợi ích hai chiều. Tuy nhiên đổ các vấn đề kinh tế vĩ mô như lạm phát cho mạng xã hội thì hơi quá
    • Cuối cùng, đừng quên rằng bạn chính là sản phẩm
  • LinkedIn đã biến thành một mạng xã hội khoe mẽ kiểu TikTok. Đây là một cấu trúc hợp thức hóa việc lãng phí thời gian dưới danh nghĩa “tích lũy kiến thức ngành”
    Tràn ngập ở đó không phải chuyên gia thực thụ mà là những người sống bằng thương hiệu cá nhân

    • Phần lớn người dùng hầu như không xem feed. Họ chỉ dùng nó để quản lý liên hệ hoặc nhắn tin. Feed chỉ là nhiễu, nên bỏ qua là xong
    • Tôi dùng LinkedIn như một kênh một chiều (write-only), và thực sự đã gặp được nhiều mối quan hệ tốt ngoài đời
    • Nếu giữ một chính sách mạng lưới nghiêm ngặt chỉ kết nối với những người đã gặp trực tiếp thì feed sẽ sạch hơn nhiều
  • Tôi ấn tượng với đoạn trong bài nói rằng “đã quét hộ chiếu châu Âu nhưng toàn bộ dữ liệu lại chuyển đến các công ty Bắc Mỹ”
    Tôi không nghĩ có thể xem LinkedIn là một mạng lưới có trụ sở ở châu Âu

    • Có lẽ tác giả muốn nói đến “mạng lưới của bản thân ở châu Âu”
    • Nếu ở châu Âu thì nên dùng Xing, nhưng ở đó chắc sẽ quá cô đơn
    • Những cách diễn đạt như “Let that sink in” khiến tôi nghi ngờ vì trông giống dấu vết của văn bản do GPT tạo ra
    • Người châu Âu dùng LinkedIn là vì hiệu ứng mạng lưới. Việc tập trung công nghệ quanh Mỹ là một sai lầm lớn, và nên nuôi dưỡng các lựa chọn nội địa như cách Trung Quốc đã làm
  • Cần có kiểu chủ nghĩa hoạt động vì quyền riêng tư như thế này. Tôi cũng đã xác minh LinkedIn, nhưng danh sách biện pháp ứng phó khả thi mà tác giả đưa ra rất ấn tượng

  • Gần đây tôi liên tục gặp thông báo lỗi kiểu “email không được nhận”. Nhưng thực ra email vẫn nhận bình thường
    Bấm nút thì chỉ hiện “đã xảy ra sự cố”, và dù là người dùng trả phí cũng không được giải quyết
    Đội hỗ trợ còn nói sẽ gửi email tới chính địa chỉ đó nên thật hết nói nổi. Cấu trúc như vậy lại càng khiến tôi cảm thấy cần có sự phi tập trung

    • Có vẻ như hệ thống tổng đài được cố tình thiết kế phức tạp như vậy. Nhân viên tuyến dưới không có quyền hạn, chỉ lặp đi lặp lại việc chuyển ticket hoặc chuyển bộ phận.
      Ngay cả hệ thống điện thoại dùng nhận dạng giọng nói AI cũng còn bất tiện hơn. Cảm giác như nó đã trở thành một độ phức tạp cấu trúc quái vật tích tụ qua hàng thập kỷ
    • Cũng có người gợi ý kiểm tra xem bạn có đang chặn tải ảnh từ xa hay không. Nhiều nơi đo việc email có được nhận hay không bằng tracking pixel