- Quy trình xác minh danh tính của LinkedIn hoàn tất khi người dùng gửi hộ chiếu và ảnh khuôn mặt, nhưng dữ liệu thực tế được chuyển không phải cho LinkedIn mà cho công ty Mỹ Persona
- Persona thu thập một lượng lớn dữ liệu cá nhân như ảnh hộ chiếu, dữ liệu sinh trắc học để nhận diện khuôn mặt, dữ liệu chip NFC, thông tin thiết bị và vị trí
- Dữ liệu này được sử dụng để huấn luyện AI, với cơ sở pháp lý được nêu là “lợi ích hợp pháp (legitimate interest)”, nên có thể được xử lý mà không cần sự đồng ý rõ ràng
- Trong 17 đơn vị xử lý phụ (subprocessor) của Persona, có 16 công ty Mỹ, và các công ty AI như OpenAI, Anthropic phân tích dữ liệu hộ chiếu và khuôn mặt
- Theo CLOUD Act của Mỹ, ngay cả dữ liệu được lưu trên máy chủ tại châu Âu cũng có thể bị chính phủ Mỹ truy cập, nên việc bảo vệ dữ liệu cá nhân của người dùng châu Âu trên thực tế không được bảo đảm
Cấu trúc thực tế của quy trình xác minh LinkedIn
- Khi nhấn nút
Verify của LinkedIn, người dùng sẽ được chuyển hướng tới Persona Identities, Inc. (đặt tại San Francisco)
- LinkedIn là khách hàng doanh nghiệp, còn người dùng trở thành đối tượng xử lý dữ liệu của Persona
- Phần lớn người dùng gửi hộ chiếu và ảnh khuôn mặt mà không hề nhận thức được sự tồn tại của Persona
Dữ liệu Persona thu thập
- Trong quá trình xác minh danh tính, Persona thu thập các thông tin sau
- Tên, toàn bộ ảnh hộ chiếu, ảnh selfie thời gian thực, hình học khuôn mặt (dữ liệu sinh trắc học)
- Dữ liệu chip NFC, số ID quốc gia, giới tính, ngày sinh, email, số điện thoại, địa chỉ
- Địa chỉ IP, thông tin thiết bị·trình duyệt, ngôn ngữ, thông tin vị trí
- Ngoài ra còn theo dõi cả “phát hiện do dự”, “phát hiện sao chép·dán” và các dữ liệu sinh trắc học hành vi (behavioral biometrics) khác
Đối chiếu chéo dữ liệu với bên thứ ba
- Ngoài thông tin do người dùng cung cấp, Persona còn tiến hành đối chiếu chéo với cơ sở dữ liệu chính phủ, tổ chức tín dụng, nhà mạng, công ty tiện ích công cộng
- Đây không chỉ là xác minh danh tính đơn thuần mà là mức tra cứu dữ liệu gần như một cuộc kiểm tra lý lịch
Sử dụng làm dữ liệu huấn luyện AI
- Theo chính sách quyền riêng tư, ảnh hộ chiếu và ảnh selfie được tải lên sẽ được dùng để huấn luyện mô hình AI
- Mục đích là cải thiện khả năng nhận diện hộ chiếu theo từng quốc gia và nâng cao dịch vụ
- Cơ sở pháp lý là “lợi ích hợp pháp”, nên có thể xử lý mà không cần sự đồng ý rõ ràng của người dùng
- Việc này có xâm phạm các quyền cơ bản theo GDPR hay không vẫn chưa rõ ràng
Các chủ thể chia sẻ và truy cập dữ liệu
- Thông tin LinkedIn nhận được gồm tên, năm sinh, loại giấy tờ tùy thân, cơ quan cấp, kết quả xác minh và bản sao giấy tờ tùy thân đã làm mờ
- Persona cũng chia sẻ dữ liệu với các bên sau
- Nhà cung cấp dịch vụ và đối tác dữ liệu, các công ty liên kết, bên mua lại tiềm năng, cơ quan thực thi pháp luật
- Danh sách 17 đơn vị xử lý phụ (subprocessor) bao gồm
- Anthropic, OpenAI, Groqcloud (trích xuất·phân tích dữ liệu)
- Các dịch vụ hạ tầng và cơ sở dữ liệu như AWS, Google Cloud, Snowflake, MongoDB
- Các nhà cung cấp API thanh toán·liên lạc như Stripe, Twilio
- Trong số 17 đơn vị này, 16 ở Mỹ, 1 ở Canada, và không có công ty nào trong EU
CLOUD Act và vấn đề chủ quyền dữ liệu
- Persona vận hành các trung tâm dữ liệu tại Mỹ và Đức, nhưng vì là pháp nhân Mỹ nên thuộc phạm vi áp dụng của CLOUD Act
- Tòa án Mỹ có thể truy cập dữ liệu được lưu trên máy chủ ở nước ngoài thông qua lệnh pháp lý
- Chính sách của Persona nêu rõ “cung cấp dữ liệu khi có yêu cầu vì mục đích thực thi pháp luật·an ninh quốc gia”
- Có thể kèm theo lệnh bịt miệng (gag order), nên người dùng có thể sẽ không được thông báo
Giới hạn của EU-US Data Privacy Framework
- Persona có chứng nhận EU-US Data Privacy Framework (DPF)
- Tuy nhiên đây là cơ chế thay thế cho Privacy Shield, và hiệu lực pháp lý dựa trên Executive Order
- Nếu chính quyền thay đổi trong tương lai, khả năng bị rút lại vẫn tồn tại
- Các tổ chức bảo vệ quyền riêng tư như noyb đã nộp đơn thách thức pháp lý
Rủi ro của dữ liệu sinh trắc học và ngoại lệ lưu trữ
- Persona nêu rõ dữ liệu hình học khuôn mặt sẽ được xóa sau khi xác minh hoàn tất hoặc trong vòng 6 tháng
- Tuy nhiên có ngoại lệ lưu trữ khi có yêu cầu pháp lý, nên theo lệnh của tòa án Mỹ có thể bị lưu giữ vô thời hạn
- Dữ liệu sinh trắc học là định danh duy nhất không thể thay đổi, nên nếu bị rò rỉ thì không thể khôi phục
Trách nhiệm pháp lý và quyền của người dùng
- Mức bồi thường thiệt hại của Persona bị giới hạn ở 50 USD
- Tranh chấp chỉ có thể được xử lý bằng trọng tài cá nhân bắt buộc thông qua tổ chức trọng tài Mỹ (AAA)
- Với người dùng EU, tài liệu ghi rõ áp dụng luật Ireland, nhưng do CLOUD Act được ưu tiên áp dụng, mức bảo vệ thực tế là rất yếu
Các biện pháp được đề xuất cho người dùng
- Người dùng đã hoàn tất xác minh có thể thực hiện các việc sau
- Yêu cầu truy cập dữ liệu: idv-privacy@withpersona.com
- Yêu cầu xóa: yêu cầu xóa dữ liệu không cần thiết sau khi xác minh hoàn tất
- Liên hệ DPO: có thể gửi phản đối về việc sử dụng cho huấn luyện AI tới dpo@withpersona.com
- Cân nhắc lại việc xác minh: cần xem trọng bảo vệ dữ liệu sinh trắc học hơn một huy hiệu đơn giản
Kết luận
- Xác minh danh tính của LinkedIn chỉ mất 3 phút, nhưng để hiểu luồng dữ liệu thực sự thì phải đọc 34 trang tài liệu pháp lý
- Người dùng đang cung cấp hộ chiếu, khuôn mặt, dữ liệu sinh trắc học, hồ sơ tín dụng cho một công ty Mỹ, đồng thời
phải đối mặt với khả năng huấn luyện AI·truy cập của chính phủ·lưu trữ theo ngoại lệ pháp lý
- Dữ liệu của người dùng châu Âu trên thực tế đang nằm dưới hệ thống pháp luật Mỹ
- Đây là một cấu trúc trong đó người dùng trao toàn bộ danh tính cá nhân chỉ để lấy một huy hiệu xanh đơn giản
2 bình luận
Có vẻ việc này cũng được tận dụng nhiều một cách khá bất ngờ trong các hoạt động phản gián nội địa ở Mỹ.
Ý kiến từ Hacker News
CEO của Persona đã trực tiếp giải thích trên LinkedIn
Dữ liệu cá nhân không được dùng để huấn luyện AI, dữ liệu sinh trắc học sẽ bị xóa ngay sau khi xác minh danh tính, và phần dữ liệu còn lại sẽ tự động bị xóa trong vòng 30 ngày
Trên thực tế, khi bộ phận pháp lý can thiệp thì tài liệu thường được soạn quá bao quát. Nó có thể trông u ám hơn nhiều so với thực tế, nên những lời giải thích như vậy vẫn có ý nghĩa trong việc bảo đảm tính minh bạch
Trước đây tôi từng tạo một địa chỉ email riêng chỉ để đăng ký LinkedIn, và ngay khi xóa tài khoản thì spam email bắt đầu đổ về địa chỉ đó
Tôi muốn tự làm thử nghiệm, nhưng họ đã đánh mất lòng tin rồi. Tôi tin rằng LinkedIn đã bán dữ liệu
Khi tạo tài khoản mới, tôi đã bị ép xác minh danh tính. Tôi phải xác minh bằng hộ chiếu, nhưng sau đó khi kiểm tra dữ liệu cá nhân thì gần như chẳng có thông tin nào được cung cấp
Cài đặt quảng cáo mặc định đều bật, và toàn bộ quá trình rất khó chịu.
Vì là tài khoản dùng cho công ty nên tôi buộc phải làm, nhưng điều đó khiến tôi càng thấy cần có dịch vụ thay thế phi tập trung
Tôi nghĩ việc xác minh danh tính qua Persona rốt cuộc cũng là góp phần làm giàu dữ liệu của chính phủ (enrichment)
Các dịch vụ lớn như Coursera, Wealthsimple, Lime đã phụ thuộc vào nó nên rất khó tránh, nhưng vẫn cần bảo đảm pháp lý về việc sử dụng dữ liệu
Những khu vực đang bàn về chủ quyền số như Canada hay châu Âu cần nuôi dưỡng các lựa chọn thay thế trong khu vực
Persona có vẻ không đủ năng lực đáng tin cậy để xử lý dữ liệu cá nhân ở quy mô lớn
Bài blog liên quan: https://vmfunc.re/blog/persona
Cấu trúc cốt lõi của các nền tảng như LinkedIn, Google, Facebook là bán người dùng như một món hàng
Nếu ai đó trả tiền để nhắm mục tiêu vào bạn, thì số tiền đó cuối cùng cũng sẽ được thu lại từ chính bạn
Tôi nghĩ kiểu cấu trúc này về lâu dài đã làm trầm trọng thêm bất bình đẳng kinh tế
LinkedIn đã biến thành một mạng xã hội khoe mẽ kiểu TikTok. Đây là một cấu trúc hợp thức hóa việc lãng phí thời gian dưới danh nghĩa “tích lũy kiến thức ngành”
Tràn ngập ở đó không phải chuyên gia thực thụ mà là những người sống bằng thương hiệu cá nhân
Tôi ấn tượng với đoạn trong bài nói rằng “đã quét hộ chiếu châu Âu nhưng toàn bộ dữ liệu lại chuyển đến các công ty Bắc Mỹ”
Tôi không nghĩ có thể xem LinkedIn là một mạng lưới có trụ sở ở châu Âu
Cần có kiểu chủ nghĩa hoạt động vì quyền riêng tư như thế này. Tôi cũng đã xác minh LinkedIn, nhưng danh sách biện pháp ứng phó khả thi mà tác giả đưa ra rất ấn tượng
Gần đây tôi liên tục gặp thông báo lỗi kiểu “email không được nhận”. Nhưng thực ra email vẫn nhận bình thường
Bấm nút thì chỉ hiện “đã xảy ra sự cố”, và dù là người dùng trả phí cũng không được giải quyết
Đội hỗ trợ còn nói sẽ gửi email tới chính địa chỉ đó nên thật hết nói nổi. Cấu trúc như vậy lại càng khiến tôi cảm thấy cần có sự phi tập trung
Ngay cả hệ thống điện thoại dùng nhận dạng giọng nói AI cũng còn bất tiện hơn. Cảm giác như nó đã trở thành một độ phức tạp cấu trúc quái vật tích tụ qua hàng thập kỷ