- Kết quả tạo địa chỉ email riêng biệt cho từng dịch vụ để theo dõi cho thấy email từ bên thứ ba đã được gửi tới địa chỉ chỉ dùng cho BrowserStack
- Sau khi đăng ký chương trình mã nguồn mở của BrowserStack, email bên ngoài được gửi qua Apollo.io đã được nhận tại địa chỉ đó
- Ban đầu Apollo.io nói đây là địa chỉ được tạo bằng thuật toán dựa trên thông tin công khai, nhưng sau đó sửa lại rằng BrowserStack đã cung cấp dữ liệu
- Dù đã liên hệ BrowserStack nhiều lần, không nhận được phản hồi, và ba khả năng được nêu ra gồm rò rỉ nội bộ, dịch vụ bên thứ ba hoặc nhân viên mang dữ liệu ra ngoài
- Vụ việc được chỉ ra là một ví dụ cho vấn đề thực tiễn trao đổi thương mại thông tin cá nhân và sự thiếu trách nhiệm của doanh nghiệp
Nghi vấn rò rỉ email người dùng BrowserStack
- Trường hợp truy vết đường rò rỉ bằng cách tạo địa chỉ email riêng cho từng dịch vụ
- Mỗi lần đăng ký một dịch vụ lại tạo một email riêng để sử dụng
- Nếu spam hoặc email bên ngoài được gửi tới một địa chỉ cụ thể, có thể lập tức xác định nó đã bị rò rỉ từ dịch vụ nào
-
Sau khi đăng ký chương trình mã nguồn mở của BrowserStack, đã nhận được email từ bên ngoài qua Apollo.io tại địa chỉ email chuyên dùng đó
- Sau vài lần trao đổi email với đội ngũ hỗ trợ BrowserStack, việc thiết lập tài khoản đã hoàn tất
- Chỉ vài ngày sau, một email từ bên thứ ba không liên quan đến BrowserStack đã đến
- Người gửi ghi rõ nguồn dữ liệu của mình là Apollo.io
- Giải thích ban đầu của Apollo.io là “thuật toán riêng dựa trên thông tin công khai”
- Họ giải thích rằng đã dùng cấu trúc email phổ biến dạng “firstname.lastname@companydomain.com”
- Tuy nhiên, địa chỉ đó chỉ dành riêng cho BrowserStack nên không thể suy ra từ thông tin công khai
- Sau khi bị chỉ ra điểm này, Apollo sửa lại phản hồi rằng BrowserStack đã cung cấp dữ liệu thông qua mạng lưới đóng góp khách hàng
- Ngày thu thập dữ liệu được ghi là 25 tháng 2 năm 2026
-
Phía BrowserStack không phản hồi dù đã được liên hệ nhiều lần
- Trái với câu “No spam, we promise!”, hoàn toàn không có phản hồi chính thức nào
- Ba kịch bản có thể xảy ra đối với đường rò rỉ đã được nêu ra
- BrowserStack trực tiếp bán hoặc cung cấp dữ liệu người dùng
- Rò rỉ thông tin từ dịch vụ bên thứ ba mà BrowserStack sử dụng
- Nhân viên nội bộ hoặc nhà thầu mang dữ liệu ra ngoài
-
Đặt vấn đề về thực tiễn thương mại hóa dữ liệu cá nhân
- So với tấn công hack ác ý, việc trao đổi dữ liệu cá nhân giữa các doanh nghiệp đã trở nên thường nhật được xem là vấn đề lớn hơn
- Đây được đánh giá là một trường hợp cho thấy thái độ thiếu trách nhiệm của doanh nghiệp đối với việc bảo vệ thông tin cá nhân
- Bài viết tiếp theo sẽ đề cập tới trường hợp Apollo thu thập số điện thoại từ các doanh nghiệp lớn
1 bình luận
Ý kiến trên Hacker News
Trước đây đã từng có trường hợp trong phần mềm diễn đàn cộng đồng OSS (hình như là KDE hoặc Qt) địa chỉ email người dùng bị vô tình chèn vào bên trong thẻ HTML
Vấn đề là các web crawler đã thu thập chúng và tạo thành cơ sở dữ liệu spam
Người ta phát hiện ra vì địa chỉ email riêng biệt của một người bạn bị dùng để gửi spam, và đội vận hành diễn đàn đã lần theo rồi sửa lỗi
Tôi nghĩ trường hợp lần này cũng có thể là một sai sót tương tự hơn là hành vi ác ý
Nhiều người gọi đây là “rò rỉ dữ liệu”, nhưng thật ra đây là cách Apollo vận hành mặc định
Nếu khách hàng không chủ động từ chối chia sẻ dữ liệu, thông tin sẽ tự động được chia sẻ
Chuyện đó có đạo đức hay hợp pháp hay không là vấn đề khác, nhưng thực tế là họ đang vận hành theo cách này
Xem chính sách chia sẻ dữ liệu khách hàng của Apollo
Những thông tin được bổ sung theo cách này sau đó sẽ trở thành dữ liệu mà mọi khách hàng của Apollo đều có thể tìm kiếm
Ví dụ, nếu tìm “email người ra quyết định ở Example Inc.” thì email của tôi cũng có thể xuất hiện
Thực ra gần như mọi đội marketing đều làm việc theo kiểu này
Chỉ là lần này OP dùng địa chỉ email riêng biệt nên nó mới bị lộ ra
Cũng có liên kết yêu cầu xóa dữ liệu cá nhân khỏi Apollo, nhưng có rất nhiều công ty cung cấp dịch vụ kiểu này
Sáng thứ Hai chắc sẽ nhận được cả đống yêu cầu liên hệ
Nhân viên sales cần credit để làm giàu dữ liệu, và họ có thể
ZoomInfo đặc biệt hung hăng, và Apollo cũng làm theo cách tương tự
Trong mô tả về việc thu thập dữ liệu của Apollo cũng có nội dung như vậy
Apollo.io được giới thiệu là “nền tảng sales AI”, nhưng về bản chất nó là một hệ thống CRM
Rất có thể ai đó trong đội sales đã tải lên toàn bộ danh sách khách hàng
Có vẻ họ thiếu nhận thức về bảo vệ dữ liệu cá nhân
Tôi tạo địa chỉ email riêng biệt cho từng dịch vụ,
nhưng dạo này nhiều dịch vụ lại “de-aliasing” những địa chỉ đó để nhận ra địa chỉ gốc
Nếu không phải là một hộp thư riêng trên một domain hoàn toàn mới thì hiệu quả sẽ giảm đi
Nếu spam gửi đến địa chỉ đó thì tôi biết ngay nó bị lộ từ đâu
Nó tạo địa chỉ ngẫu nhiên cho từng trang và lưu lại đã dùng ở đâu
Cũng hữu ích để lọc email phishing — ví dụ ngân hàng sẽ không đời nào gửi thư tới địa chỉ dùng để nhận mẫu thử thức ăn cho chó
Trước đây tôi từng vận hành một máy chủ email catch-all trên domain của mình,
nhưng spam nhiều quá nên cuối cùng phải bỏ
Có khả năng BrowserStack đã bán dữ liệu người dùng hoặc chuyển cho bên thứ ba,
hoặc cũng có thể chỉ là CSDL bị hack
BrightData gần đây cũng làm lộ dữ liệu khách hàng và đã thông báo cho khách hàng qua email
Cả hai công ty đều có thể đã dính lỗ hổng headless Chrome, hoặc cũng có thể chỉ là trùng hợp
Tôi đang vận hành một dự án theo dõi fingerprint của trình duyệt headless,
và tôi từng thấy một URL chỉ được truy cập bởi BrightData sau đó lại bị Claudebot của Anthropic truy cập
Có lẽ kẻ tấn công đã dùng Claude để phân tích dữ liệu
họ nói là bán “IP dân cư chất lượng cao” nhưng thực chất là một mạng proxy phục vụ web scraping
Compare The Market ở Anh cũng từng làm điều tương tự
Tôi dùng hai địa chỉ email riêng biệt, và cả hai đều bắt đầu nhận spam trong cùng một ngày
Tôi đã báo cáo nhưng bị phớt lờ với lý do không thể chứng minh
Xem trang GDPR của Apollo thì thấy,
họ viết rằng “sự đồng ý phải là tự do, cụ thể và rõ ràng”
Nhưng trên thực tế, họ lại nói rằng việc xử lý dữ liệu dựa trên “Lợi ích hợp pháp (Legitimate Interests)”
Vấn đề là khách hàng không thực sự kiểm chứng cơ sở đó
BrowserStack đã chia sẻ dữ liệu mà không có căn cứ pháp lý,
còn Apollo thì lại chia sẻ tiếp dữ liệu do khách hàng gửi lên mà không xác minh
Kết quả là cả hai công ty đều có khả năng vi phạm GDPR
Xem hướng dẫn GDPR của Apollo
Cảm ơn OP đã công khai vấn đề này
Nó giúp tăng tính minh bạch của doanh nghiệp
Địa chỉ email canary rất hữu ích để phân biệt nguyên nhân rò rỉ
Nếu chỉ địa chỉ dành cho một dịch vụ cụ thể nhận spam thì nhiều khả năng là bị broker dữ liệu chia sẻ lại,
còn nếu nhiều địa chỉ cùng lúc nhận spam thì khả năng cao là rò rỉ thông tin xác thực
Nói cách khác, phạm vi spam chính là đầu mối