1 điểm bởi GN⁺ 2025-11-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • Archive.today đã trở thành đối tượng điều tra của FBI; theo lệnh của tòa án, nhà cung cấp tên miền Tucows phải nộp dữ liệu người dùng
  • Lệnh này yêu cầu cung cấp dữ liệu diện rộng như địa chỉ, thông tin truy cập, thông tin thanh toán và nêu rõ biện pháp chế tài nếu không tuân thủ
  • Archive.today là dịch vụ lưu ảnh chụp nhanh trang web trong hơn 10 năm, và do né tránh quy định cùng tính ẩn danh, dịch vụ này cũng được dùng để vượt nội dung trả phí
  • Lý do FBI quan tâm vẫn chưa được công bố rõ ràng, nhưng vấn đề bản quyền, nguồn gốc người vận hành, nguồn tiền tài trợ là các hướng điều tra có thể có
  • Vụ việc này được chú ý như một ví dụ cho thấy xung đột giữa dịch vụ lưu trữ web ẩn danh và cơ quan thực thi pháp luật

Tổng quan cuộc điều tra của FBI với Archive.today

  • Archive.today là dịch vụ lưu ảnh chụp nhanh trang web đã hoạt động hơn 10 năm, tương tự Wayback Machine của Internet Archive nhưng hầu như không có ràng buộc về quy định hay pháp lý
    • Người dùng có thể xem lại các trang web trong quá khứ, và dịch vụ này thường được dùng để vượt bài viết trả phí hoặc paywall
    • Dịch vụ được cho là vận hành bằng tiền quyên góp và nguồn quỹ riêng, còn danh tính người vận hành không được công khai
  • Gần đây FBI đã yêu cầu Tucows nộp dữ liệu thông qua lệnh của tòa án
    • Lệnh yêu cầu bao gồm thông tin khách hàng của Archive.today, địa chỉ, nhật ký truy cập, lịch sử thanh toán
    • Tucows có thể bị chế tài nếu không chấp hành
    • Tính xác thực của lệnh này hiện vẫn chưa được xác nhận

Hoạt động gần đây của Archive.today và bài đăng “Canary”

  • Tài khoản X (trước đây là Twitter) chính thức của Archive.today đã im lặng hơn một năm, rồi đến cuối tháng 10 đăng một bài có chứa từ “Canary” và một URL
    • “Canary” là loài chim từng được dùng trong hầm mỏ để cảnh báo khí độc, nên được diễn giải như một ẩn dụ báo hiệu nguy hiểm
  • Tài liệu PDF đính kèm bài đăng có chứa lệnh của tòa án do FBI đưa ra
    • Tài liệu này được thu thập bằng cách nào vẫn chưa được xác nhận

Bối cảnh FBI quan tâm và khả năng điều tra

  • Lý do FBI chú ý đến Archive.today không được nêu trong lệnh của tòa án
    • Bài viết cho rằng các khả năng điều tra có thể bao gồm vi phạm bản quyền, gây quỹ thiếu minh bạch, nguồn gốc người vận hành, cách thức vận hành kỹ thuật
  • Archive.today có thể được truy cập qua nhiều tên miền như archive.is, archive.ph

Các kết quả điều tra trái ngược về danh tính người vận hành

  • Năm 2023, blogger Phần Lan Janni Patokallio cho rằng Archive.today dùng botnet đổi địa chỉ IP để vượt qua hệ thống chống scraping
    • Ông cho rằng người vận hành có thể đặt tại Nga
  • Một cuộc điều tra dân sự khác vào năm 2024 lại chỉ ra một nhà phát triển phần mềm ở New York là người vận hành
    • Cuộc điều tra này kết luận rằng giả thuyết liên quan đến Đông Âu là manh mối sai

Ý nghĩa của vụ việc

  • Lệnh của tòa án do FBI đưa ra cho thấy áp lực thực thi pháp luật mang tính quốc tế đối với các dịch vụ lưu trữ web hoạt động trong vùng xám pháp lý và dựa trên tính ẩn danh
  • Tình hình hiện nay đang thu hút chú ý đến khả năng Archive.today tiếp tục vận hành trong tương laivấn đề bảo vệ dữ liệu
  • Bản gốc được dịch từ ấn bản tiếng Đức và đăng trên bản tiếng Anh của heise online

1 bình luận

 
GN⁺ 2025-11-07
Ý kiến Hacker News
  • Chúng ta phải bảo tồn dữ liệu. FBI đang cố xóa sổ dữ liệu đó
    Tôi nghĩ con người cần có nhân quyền đối với tri thức. Ý tôi không phải là thông tin cá nhân như doxxing, mà là chính tri thức của nhân loại
    Luật hiện tại được thiết kế có lợi cho các tập đoàn khổng lồ, nhưng luật không nên trở thành công cụ hạn chế quyền tiếp cận tri thức của con người
    Wikipedia thì ổn, nhưng có quá nhiều bài quá phức tạp và chỉ chứa một góc nhìn nên khó hiểu

    • Xét về mặt lịch sử thì chuyện này còn không lọt vào Top 100 hành vi xấu xa mà FBI từng làm
    • Tôi nghĩ con người có quyền tự nhiên được tự do chia sẻ những gì mình học được. Việc trao cho người sáng tạo một mức độc quyền nhất định thì được, nhưng thời hạn bảo hộ bản quyền hiện nay là quá mức
    • Vấn đề là liên kết mặc định của archive.is ở dạng rút gọn, nên nếu trang biến mất thì mọi liên kết đều hỏng. Rủi ro trong thiết kế kiểu này cũng không đúng
    • Tôi đồng ý rằng tri thức thuộc về toàn nhân loại. Nhưng nếu vậy thì cũng không nên nổi giận khi các tập đoàn lớn scrape toàn bộ Internet
    • Không phải FBI ghét dữ liệu, mà họ chỉ thích dữ liệu khi chỉ riêng họ có thể truy cập
  • Tôi không hiểu vì sao Mỹ lại ân xá cho một tay buôn ma túy Silk Road, trong khi lại truy đuổi người vi phạm bản quyền. Hơn nữa nếu là công dân Nga thì thẩm quyền cũng còn mơ hồ
    Nhìn vào bài NPR nói về việc một chương trình của chính phủ từng theo dõi các vụ bắt cóc trẻ em Ukraine bị dừng vì thiếu kinh phí, tôi thấy đáng ra họ nên tập trung vào việc quan trọng hơn

    • Việc lạm dụng quyền ân xá của tổng thống hẳn khiến FBI khó chịu. Điều tra xong hết rồi lại bị đảo ngược vì chính trị
    • Tôi cũng từng bị FBI điều tra vì vi phạm bản quyền. Họ tưởng tôi đã kiếm được hàng triệu đô la. Màu sắc động cơ chính trị rất đậm
    • Thẩm quyền của Mỹ là vấn đề à? Chưa từng có chuyện đó ngăn được Mỹ cả
    • Chuyện này chẳng phải nên để Interpol hay UN xử lý sao? Tôi thấy khó hiểu vì sao Mỹ lại đi theo dõi trẻ em ở nước ngoài
    • Chính phủ Mỹ không quan tâm đến bản quyền tự thân. Họ chỉ hành động khi các tập đoàn lớn thấy khó chịu
  • Tôi cũng từng là mục tiêu điều tra bản quyền của FBI và thực sự đã ngồi tù
    Tôi nghĩ những vụ như vậy nên được xử lý bằng kiện dân sự, chứ không phải án hình sự
    Ưu tiên điều tra của FBI phần lớn là chính trị. Nếu không phải lừa đảo hay tội phạm rõ ràng thì họ chẳng quan tâm
    Tôi đã ghi lại trải nghiệm của mình trên trang cá nhân

  • Nhà Trắng cũng dùng archive.ph
    Cụm từ “Retail sales are booming — up 5% over last year” liên kết trực tiếp đến archive.ph
    Liên kết bài viết liên quan

    • Tại sao Nhà Trắng lại có hành động nhỏ nhen kiểu cướp traffic của Reuters như vậy nhỉ? /s
  • Có vẻ FBI đang muốn gửi thông điệp rằng chỉ các đại tập đoàn của Mỹ mới được phép cào toàn bộ Internet
    Họ độc chiếm dữ liệu để huấn luyện mô hình AI, rồi bán lại có thu phí

    • Có khi archive chỉ cần đổi thương hiệu thành một startup AI rồi tuyên bố đó là “LLM được khoa học hóa một cách khoa học” là xong. “Vi phạm bản quyền à? Không, đây là khoa học khoa học™”
  • Tôi có trả phí đăng ký cho nhiều trang tin, nhưng vẫn đọc bằng archive.is
    Không lỗi đăng nhập, không popup bắt đăng ký, cứ sạch sẽ như một trang web tĩnh

    • Tôi đoán archive.is либо có tài khoản trả phí ở các cơ quan báo chí lớn, либо chỉnh sửa HTML đã đăng nhập thông qua botnet. Có thể tham khảo công nghệ liên quan ở html-private-set-intersection
    • Trước đây tôi cũng xem kiểu đó bằng Lynx, nhưng giờ các trang đều vỡ hết rồi
    • Tôi cũng thường xem qua link HN và từng quyên góp cho archive.is. Nó không nên biến mất
    • Cũng có thể xử lý bằng bộ lọc annoyance của uBlock
    • Chẳng gì khó chịu bằng popup đăng ký nhận bản tin. Email giờ đã thành thứ công nghệ lỗi thời ở mức fax rồi
  • Mỗi khi xuất hiện một dịch vụ đơn giản giúp thế giới dễ chịu hơn một chút, kiểu gì cũng có ai đó tìm cách phá hỏng
    Như thuế phổ biến ở Pháp, hay chính sách ép buộc xác minh ứng dụng của Google

    • Ở một số nước châu Âu còn có cả việc chặn DNS Anna’s Archive
  • Xem qua link archive.is/XdQRp thì thấy cả bài chỉ có vài đoạn
    Trang gốc thì quảng cáo quá nhiều, tôi bỏ cuộc ngay ở quảng cáo thứ hai. Quá tải quảng cáo phá hỏng trải nghiệm đọc

    • Tôi cũng dùng archive.is để tránh popup đồng ý quyền riêng tư
    • chef’s kiss
    • Chắc chỉ là trùng hợp thôi
  • Trong trát đòi hầu tòa của FBI có trích dẫn các điều khoản điều tra những tội danh cụ thể như bóc lột tình dục trẻ em hay đe dọa các đối tượng được mật vụ tổng thống bảo vệ
    Một trong các đặc vụ phụ trách trước đây từng xử lý các vụ bóc lột trẻ em
    Liên kết tài liệu liên quan

    • Đây là một kịch bản đáng chú ý. Ai đó có thể lạm dụng bằng cách đăng tạm CSAM, lưu nó vào archive rồi phát tán liên kết
  • Hôm qua tôi mới biết Internet gia đình Verizon chặn archive.is
    Đổi DNS của router sang openDNS là xong. Tức là họ chỉ chặn cho có hình thức