Meta phân phối torrent và seed bộ dữ liệu 81.7TB chứa dữ liệu có bản quyền

(arstechnica.com)

3 điểm bởi GN⁺ 2025-02-08 | 1 bình luận | Chia sẻ qua WhatsApp

Các email nội bộ và tài liệu tòa án được giải mật đã làm rõ hơn cáo buộc từ phía các tác giả rằng Meta đã tải xuống bằng torrent và seed một phần bộ dữ liệu sách vi phạm bản quyền để huấn luyện AI
Tranh cãi tập trung vào việc quy mô dữ liệu thu thập từ Anna’s Archive và LibGen có đạt ít nhất 81.7TB hay không, và liệu quá trình này có vượt quá việc tải xuống đơn thuần để dẫn tới hành vi phân phối hay không
Các tin nhắn nội bộ cho thấy vẫn tồn tại lo ngại về việc dùng torrent trên laptop công ty và qua địa chỉ IP của Meta, nên phía tác giả cho rằng Meta đã nhận thức được rủi ro pháp lý
Dấu hiệu cho thấy Meta tránh dùng máy chủ Facebook và thay đổi cấu hình để giảm seed ở mức tối thiểu trở thành căn cứ then chốt để xác định liệu họ có ý thức về việc bị theo dõi tải xuống và seed hay không
Meta phản bác rằng việc huấn luyện AI dựa trên LibGen là sử dụng hợp lý, đồng thời cho rằng nguyên đơn chưa chứng minh được trường hợp tải xuống thực tế nào của bên thứ ba

Các email được giải mật hé lộ trọng tâm vụ kiện

Trong vụ kiện bản quyền do các tác giả sách khởi kiện Meta, những email được giải mật đang được dùng làm chứng cứ then chốt bất lợi cho Meta
Các tác giả cho rằng Meta đã huấn luyện mô hình AI bằng sách vi phạm bản quyền
Meta đã thừa nhận vào tháng trước rằng họ đã torrent bộ dữ liệu lớn gây tranh cãi LibGen, nhưng phương thức và quy mô cụ thể vẫn chưa rõ ràng cho đến khi tài liệu được giải mật

Quy mô torrent và nguồn dữ liệu

Theo hồ sơ tòa án từ phía tác giả, Meta bị cho là đã torrent ít nhất 81.7TB từ nhiều shadow library thông qua Anna’s Archive
- Trong đó, ít nhất 35.7TB là dữ liệu từ Z-Library và LibGen
- Hồ sơ cũng bao gồm cáo buộc rằng Meta trước đó đã torrent 80.6TB từ LibGen
Phía tác giả đánh giá quy mô torrent của Meta là “đáng kinh ngạc”, đồng thời nộp lên tòa ví dụ cho thấy hành vi sao chép trái phép lượng dữ liệu nhỏ hơn rất nhiều, chỉ bằng 0.008% quy mô tác phẩm mà Meta bị cáo buộc sao chép, cũng từng dẫn đến đề nghị điều tra hình sự

Việc seed ảnh hưởng thế nào đến cáo buộc xâm phạm trực tiếp

Các tác giả tập trung vào việc liệu hành vi dùng torrent của Meta có đi xa hơn tải xuống đơn thuần để bao gồm cả seed hay không
Vì seed có thể dẫn tới việc chia sẻ tệp torrent ra bên ngoài, đây là điểm then chốt củng cố lý thuyết phân phối trong cáo buộc xâm phạm bản quyền trực tiếp từ phía tác giả
Meta đã phản đối nỗ lực của phía tác giả nhằm xem xét dữ liệu torrent và seed của Meta, và trước đó tòa đã bác yêu cầu kiểm tra đó
Sau đó, phía tác giả cho biết họ đã có được chứng cứ riêng, và cho rằng tài liệu nội bộ chứa dấu hiệu cho thấy nhân viên Meta ý thức được rủi ro pháp lý của việc dùng torrent

Lo ngại pháp lý trong các tin nhắn nội bộ

Kỹ sư nghiên cứu Meta Nikolay Bashlykov đã viết trong một tin nhắn tháng 4/2023 rằng việc dùng torrent trên laptop công ty “có cảm giác không đúng”, đồng thời bày tỏ lo ngại về việc dùng địa chỉ IP của Meta để “load pirate content qua torrent”
Đến tháng 9/2023, Bashlykov trực tiếp hỏi bộ phận pháp lý và nhấn mạnh rằng việc dùng torrent đồng nghĩa với seed tệp, tức chia sẻ nội dung ra bên ngoài, nên “có thể không ổn về mặt pháp lý”
Phía tác giả xem các email này là bằng chứng cho thấy Meta đã biết về tính bất hợp pháp của hành vi đó
Theo lập luận của phía tác giả, Meta đã cố che giấu việc dùng torrent nhiều nhất có thể khi tải xuống và seed dữ liệu ở quy mô terabyte từ nhiều shadow library cho đến tận tháng 4/2024

Nghi vấn che giấu việc seed và phản ứng của Meta

Phía tác giả cho rằng Meta đã không dùng máy chủ Facebook để tải bộ dữ liệu nhằm tránh rủi ro bị truy vết “seeder/downloader” về máy chủ Facebook
- Một tin nhắn nội bộ của nhà nghiên cứu Meta Frank Zhang mô tả công việc này là stealth mode
- Theo lời khai của giám đốc phụ trách quản lý dự án Michael Clark, Meta đã thay đổi cấu hình để giảm seed ở mức tối thiểu khi có thể
Phía tác giả cho rằng thông tin mới mâu thuẫn với lời khai trước đó và cần thẩm vấn lại các nhân viên Meta liên quan đến quyết định torrent LibGen
Mark Zuckerberg nói rằng ông không tham gia vào quyết định dùng LibGen để huấn luyện mô hình AI, nhưng phía tác giả cho rằng các tin nhắn được giải mật cho thấy quyết định dùng LibGen được đưa ra sau khi đã báo cáo trước cho “MZ”

Lập luận sử dụng hợp lý và các bước tố tụng còn lại

Trong suốt quá trình kiện tụng, Meta vẫn liên tục lập luận rằng việc huấn luyện AI bằng LibGen là sử dụng hợp lý
Trong đơn đề nghị bác vụ kiện tháng trước, Meta cho rằng nguyên đơn không thể đưa ra dù chỉ một trường hợp cụ thể nào cho thấy bên thứ ba thực sự đã tải xuống một phần sách thông qua torrent của Meta, đồng thời cũng không chứng minh được rằng sách của nguyên đơn đã bị Meta phân phối
Trong khi quá trình chứng cứ giới hạn đang được tiến hành xoay quanh vấn đề seed của Meta, hiện Meta không tranh chấp phần cáo buộc seed trong yêu cầu xâm phạm bản quyền trực tiếp
Meta nói với tòa rằng họ sẽ chỉnh lại hồ sơ ở giai đoạn phán quyết rút gọn và bác bỏ rằng cáo buộc này không có cơ sở

1 bình luận

GN⁺ 2025-02-08

Ý kiến trên Hacker News

Nhìn việc các LLM biết các tác phẩm có bản quyền như bách khoa toàn thư, tôi nghĩ tất cả đều đã làm tương tự
Nhìn rộng hơn, YouTube ban đầu cũng là một thành phố ma, rồi lớn lên khi các chương trình TV có bản quyền được đăng lên; Google cũng phát triển nhờ lập chỉ mục dữ liệu của người khác mà không trả thù lao; và thư viện nhạc thời kỳ đầu của Spotify cũng là nhạc sao chép bất hợp pháp
Các công ty bảo vệ quyền sở hữu trí tuệ của mình một cách quyết liệt, nhưng lại không ngần ngại xâm phạm quyền của người khác; cá nhân thì không có đặc quyền như vậy. Cắm laptop vào một tủ mạng ở MIT rồi tải bài báo khoa học xuống là bạn mất cả cuộc đời
- Những người ở đây đều đủ thông minh, nên chỉ cần đừng tham gia và tiết kiệm tiền là được
  Đừng trả tiền cho hàng hóa số. Netflix tăng giá thì trên torrent có mọi chương trình; Spotify tăng giá thì toàn bộ bài hát của nghệ sĩ bạn thích cũng có trên torrent; hãng game đòi giá tiền thật cho trang phục số thì cứ tìm bản crack và chơi trên server riêng
  Các công ty trị giá hàng tỷ đô đã cho thấy họ không quan tâm đến bạn; với những người than phiền rằng họ mất lương, chỉ cần đáp lại: “cảm ơn vì đã trả tiền”. Nếu muốn trực tiếp giúp nhà sáng tạo, hãy đi xem biểu diễn hoặc gửi séc; còn nếu không chỉ ra được người thật sự bị thiệt hại thì khỏi bận tâm
- Vấn đề không phải là doanh nghiệp làm những việc này mà vẫn thoát, mà là chỉ cá nhân mới bị trừng phạt. Chính nỗ lực nhốt thông tin sau một hệ thống luật pháp ác mộng mới là vấn đề
  Giờ tôi gần như không còn tin vào lập luận “bản quyền khuyến khích sáng tạo” nữa. Bản quyền khuyến khích sáng tạo của các tập đoàn lớn giống như quảng cáo, nhưng cũng như quảng cáo, phần lớn còn khuyến khích những sáng tạo có giá trị thấp
  Thứ mà các cá nhân sáng tạo cần không phải là bản quyền, mà là một mạng lưới an sinh cho họ tự do dành thời gian cho sự sáng tạo tự nhiên trào dâng. Nếu mục tiêu là khuyến khích sáng tạo, thì bản quyền là một thứ thay thế tệ hại và đắt đỏ cho thu nhập cơ bản
- Câu “cắm laptop vào một tủ mạng ở MIT rồi tải bài báo khoa học xuống là bạn mất cả cuộc đời” là ám chỉ Aaron Swartz
  Là đồng sáng lập Reddit và một nhà hoạt động, anh phải đối mặt với 35 năm tù và khoản phạt 1 triệu đô la chỉ vì tải xuống nhiều bài báo học thuật từ JSTOR; áp lực đó cuối cùng đã khiến anh qua đời. Cầu mong anh yên nghỉ
- Người đăng các chương trình TV có bản quyền không phải nhân viên YouTube mà là người dùng cuối, và YouTube đã gỡ theo yêu cầu DMCA, nên có thể nói họ gần như đã tuân thủ luật
  Việc thu thập các website công khai để tạo chỉ mục tìm kiếm không giống với việc tạo ra một LLM có thể tái hiện nguyên văn nội dung gốc mà không ghi nguồn. Tuy vậy, vẫn có chỗ để tranh luận về tính biến đổi sau cùng của LLM
  Thư viện nhạc của Spotify cũng không phải phiên bản được cung cấp rộng rãi cho công chúng, và có vẻ họ đã làm vậy với sự cho phép của chủ sở hữu bản quyền
- Đế quốc Anh từng cố duy trì độc quyền đối với máy dệt chạy bằng hơi nước, và Mỹ đã dùng thủ đoạn để nhảy vào cạnh tranh
  Trước đó nữa, Đế quốc Anh đã bứt lên nhờ đánh cắp vàng từ Tây Ban Nha, còn Tây Ban Nha thì đang bóc lột người Aztec và người bản địa Mexico
  Chuyện này luôn tồn tại, nhưng văn hóa không vận hành như các widget vật lý, nên không nên để một số ít người đánh cắp lợi ích của việc sao chép số bằng các cơ chế tạo khan hiếm nhân tạo như DRM, bản quyền, bằng sáng chế
Càng biết thêm các công ty AI đã huấn luyện mô hình như thế nào, càng rõ rằng phần còn lại chúng ta chỉ là những kẻ bị lừa
Chúng ta tin rằng luật pháp quan trọng, rằng trong công việc tuyệt đối không được bóp méo hay che giấu những gì mình làm, và rằng phải tuân thủ điều khoản của chúng ta cũng như điều khoản của các website, sản phẩm khác
Khi đăng ký website hay nội dung, chúng ta nghĩ phải luôn dùng email công ty để bên kia có thể đưa ra phán đoán hợp lý về việc có cho phép truy cập hay không; nhưng thật ra ngay từ đầu đáng lẽ đã phải cứ YOLO mà lao tới. Chưa bị bắt thì chưa phải bất hợp pháp, và nếu bạn đủ lớn trước khi bị bắt thì các quy tắc không còn áp dụng nữa
- Nếu trước đây còn có nghi ngờ, thì nay người nắm quyền lực cao nhất đã đích thân minh họa bài học đó, lại còn được lá phiếu phổ thông phê chuẩn
  Phần thưởng cho hành xử có đạo đức, đáng tiếc, đôi khi chỉ là sự thỏa mãn cá nhân. Nghĩ đến những tấm gương trẻ em nhìn thấy quanh mình, nuôi con trong môi trường như thế này chắc thật sự khó
- Không phải là “ngay từ đầu đáng lẽ đã phải cứ YOLO mà lao tới”. Thái độ thật sự giống kẻ bị lừa là bắt chước họ
  Vì tôn trọng chính bản thân, bạn nên hành xử có đạo đức và chính trực. Tôi chưa bao giờ ảo tưởng rằng các công ty công nghệ lớn tôn trọng pháp luật, nhưng đó là chuyện tách biệt với tôi
- Nếu có vài giờ rảnh, tập về Meta của podcast Acquired khá khai sáng
  Họ có vẻ đã lần mò thực hiện hết thí nghiệm growth hacking này đến thí nghiệm khác mà chẳng đánh giá rủi ro hay có ý thức đạo đức gì đáng kể
- “Chưa bị bắt thì chưa phải bất hợp pháp” là không chính xác
  Ngay cả khi bị bắt, nó chỉ bất hợp pháp nếu bạn là loại người sai. Với đúng loại người, thậm chí còn chẳng bị khẽ tay một cái
Tôi không hiểu vì sao việc Meta có huấn luyện LLM bằng tài liệu có bản quyền hay không lại còn là câu hỏi. Trong bài báo của họ đã viết như vậy
Bài báo LLaMA [Touvron et al., 2023] nói rằng “tập dữ liệu huấn luyện bao gồm hai kho ngữ liệu sách: Project Gutenberg và mục Books3 của ThePile”
Nếu lần theo tài liệu tham chiếu đó, Books3 được mô tả là tập dữ liệu sách phái sinh từ bản sao nội dung của tracker riêng Bibliotik do Shawn Presser công bố. (Presser, 2020) trỏ tới https://twitter.com/theshawwn/status/1320282149329784833, và buồn cười là còn tham chiếu cả chính sách DMCA này: https://the-eye.eu/dmca.mp4
Hơn nữa, họ cũng nói đã huấn luyện bằng GitHub, các trang web và ArXiv, tất cả đều chứa nội dung có bản quyền. Câu hỏi cốt lõi là liệu việc huấn luyện, sử dụng và phân phối các mô hình AI, trọng số và đầu ra được huấn luyện bằng tài liệu có bản quyền có hợp pháp hay không; còn bản thân việc đã huấn luyện bằng tài liệu có bản quyền thì là điều chắc chắn
[Touvron et al., 2023] https://arxiv.org/pdf/2302.13971
[Gao et al., 2020] https://arxiv.org/pdf/2101.00027
- Điểm mấu chốt là khi tải bằng torrent, họ đã trực tiếp phân phối bản sao tài liệu có bản quyền
  Đây là một hành vi xâm phạm độc lập, tách biệt với cuộc tranh luận về LLM đã được huấn luyện
- Vấn đề huấn luyện LLM bằng dữ liệu được bảo hộ “bản quyền” có hai trường hợp khác nhau, nhưng hầu như không được phân biệt
  Thứ nhất là huấn luyện bằng tài liệu có bản quyền nhưng có thể truy cập công khai. Nếu bạn viết một bài thơ rồi đăng lên mạng để cả thế giới đọc, đó là tài sản trí tuệ của bạn và người khác không thể lấy đi bán, nhưng họ được tự do đọc và lấy cảm hứng. Trong trường hợp này, tính hợp pháp của việc huấn luyện đang được tòa án xem xét, và cho đến nay có vẻ nghiêng về phía LLM
  Thứ hai là huấn luyện bằng tài liệu có bản quyền không được công khai. Về bản chất đó là bản sao lậu, hoặc là tài liệu có được bằng cách đi đường vòng để tránh chi phí. Nếu một bài thơ nằm sau tường phí mà lại được LLM biết đến mà không trả tiền, thì vì về mặt pháp lý phải trả tiền mới được xem tác phẩm, đơn giản đó là bất hợp pháp. Tuy vậy, vẫn có thể phải xem xét các điều kiện kiểu như mua quyền truy cập kho lưu trữ rồi huấn luyện trên mọi thứ bên trong
- Việc nó được dùng để huấn luyện không có nghĩa là nó được đưa vào trạng thái cuối cùng theo cách có ý nghĩa
  Nếu người dùng hack để moi ra từ mô hình những mảnh dữ liệu thô mà họ có thể dễ dàng chỉ cần đổi phong cách cho giống, thì tôi nghi ngờ liệu đó có thật sự là xâm phạm bản quyền hay không. Nếu cần tới hai mô hình thì sao
  Có lẽ giờ ta phải chấp nhận rằng khả năng con người trực tiếp phán đoán các nỗ lực đạo văn đã chạm tới giới hạn rồi. Giống như việc khó phân biệt giọng Sky với giọng trong Her vậy
Tôi rất khuyến nghị đọc bài diễn văn về bản quyền của Thomas Babington Macaulay. Ông giải thích rất logic về mục đích, thời hạn và rủi ro của bản quyền
Đặc biệt, người ta thường lập luận rằng khi tác giả chết và để gia đình lại trong cảnh nghèo khó, việc gia hạn bản quyền là một cách công bằng để ngăn điều đó; nhưng trong đa số trường hợp, gia đình còn lại chưa từng nắm bản quyền
Ban đầu tác giả bán quyền sao chép cho nhà xuất bản, rồi nhà xuất bản không xuất bản tác phẩm mà cất giữ, chờ đến khi tác giả bị đẩy vào cảnh nghèo khó để buộc họ chuyển nhượng hẳn bản quyền với giá rẻ mạt. Trong những trường hợp như vậy, gia hạn bản quyền chỉ làm lợi cho nhà xuất bản và còn làm tăng động cơ chiếm đoạt bản quyền
- Thomas Babington Macaulay chẳng phải là người đã cho dịch tệ hại các sách tiếng Phạn của Ấn Độ giáo rồi nói rằng “một kệ sách trong một thư viện châu Âu tốt còn có giá trị hơn toàn bộ văn học bản địa của Ấn Độ và Ả Rập” sao
  Một người như vậy dạy chúng ta về bản quyền ư? Xin kiếu
- Tôi rất ghét quyền sở hữu trí tuệ và tin chắc những chuyện như vậy đã xảy ra, nhưng công bằng mà nói, nếu bản quyền được kéo dài đến sau khi tác giả qua đời thì số tiền tác giả có thể nhận khi bán nó lúc đầu cũng tăng lên
- Thứ tác giả có thể bán được là một tài sản có giá trị nhờ có bảo hộ bản quyền
  Dù tác giả có bán quyền hay không, tác giả và gia đình họ đều khá hơn như nhau khi có bản quyền
- Một ví dụ đơn lẻ như vậy không khiến hành vi trộm cắp trở nên chấp nhận được. Điều bạn đang ám chỉ chính là như thế
Libgen là một dự án văn minh cần được ủng hộ, chứ không phải bị truy tố
Tôi hy vọng một ngày nào đó mọi người sẽ nhìn lại và thấy chúng ta ngày nay ngu ngốc đến mức nào khi bài xích bộ sưu tập tác phẩm văn học lớn nhất trong lịch sử nhân loại
- Anna's Archive khuyến khích dùng thư viện bóng tối của họ để huấn luyện LLM, thậm chí còn kiếm tiền từ đó
  Trang web có một trang riêng, và nếu trả tiền thì họ cho tải toàn bộ tập dữ liệu với tốc độ cao
- Tôi tò mò không biết vụ kiện này đã làm lưu lượng truy cập Libgen tăng thêm bao nhiêu
  Khi Metallica kiện Napster, phản ứng của nhiều người là “khoan đã, có thể tải nhạc miễn phí à?”
- Libgen trở thành vấn đề khi các công ty phát triển AI tạo sinh sử dụng nó
  Vì điều đó giúp các hãng sản xuất GPU kiếm tiền, hoặc như OpenAI thì chính họ kiếm tiền bằng dịch vụ trả phí
- Tôi nghĩ bạn đang phóng đại tầm quan trọng của nó. Nhờ Internet, hiện nay gần như sách nào cũng có thể đặt mua để nhận tận cửa trong vòng một tuần, hoặc nhận ngay trên máy đọc sách điện tử
  Thư viện địa phương có lẽ cũng tham gia hệ thống mượn liên thư viện, cho phép bạn yêu cầu miễn phí sách từ bất kỳ thư viện nào trên toàn quốc
  LibGen chỉ cho tiếp cận một tập tác phẩm nhỏ hơn nhiều so với cả hai cách đó và tiện hơn đôi chút mà thôi. Khác biệt lớn nhất là tác giả hoàn toàn không được bồi thường. Cứ đến thư viện thật là được
Có vẻ ai cũng thích ghét các tập đoàn lớn, đặc biệt là Meta, và coi đây là cơ hội để kêu gọi trừng phạt họ
Nhưng hướng đi khôn ngoan hơn là kêu gọi thay đổi luật sở hữu trí tuệ
- Tôi chán ngấy tiêu chuẩn kép rồi
  https://en.wikipedia.org/wiki/Aaron_Swartz#United_States_v._...
  https://en.wikipedia.org/wiki/Aaron_Swartz#Death
  Aaron Swartz bị quấy nhiễu đến mức bị đẩy tới tự sát, còn các công ty này sẽ ung dung bước ra và kiếm hàng chục tỷ đô. Theo tôi, cứ đối xử với mọi CEO công nghệ theo kiểu Swartz rồi sau đó đổi luật là được
- Đang trộn lẫn các vấn đề khác nhau
  Các tập đoàn lớn quá lớn và đơn giản là không nên tồn tại. Khi một công ty trở nên mạnh hơn cả những chính quyền bang lớn nhất, đó không phải là tính năng mà là lỗi
  Luật sở hữu trí tuệ có thể cần được xem xét lại. Nhưng nói rằng vì các tập đoàn lớn đứng trên luật pháp nên phải xóa bỏ luật thì chẳng giúp ích gì. Trước hết phải loại bỏ các tập đoàn lớn, rồi sau đó mới nghĩ đến một bộ luật công bằng. Dù bây giờ có đổi luật thì cũng chẳng có gì thay đổi, vì các công ty này vốn đã đứng trên luật pháp rồi
- Thật lòng mong Meta gặp một sự cố bảo mật nghiêm trọng khiến cả công ty bị thiêu rụi hoàn toàn
  Dù vậy, nếu họ phải bị thiêu rụi thì cũng phải vì lý do đúng. Việc tải xuống dữ liệu lẽ ra nên được công khai cho công chúng không phải là lý do đó
- Các tập đoàn lớn không có đạo đức hay luân lý. Nếu có lợi, họ sẽ vi phạm bất kỳ luật nào
  Phàn nàn với Meta hay Zuck cũng vô ích. Meta đang hành xử đúng như cách nó được thiết kế. Nếu không thích, hãy bỏ phiếu cho nhiều quy định hơn
- Trừng phạt trước, rồi sau đó đổi luật là được
Điều này làm tôi nhớ đến những người Internet điên rồ ngày xưa từng nghĩ luật bản quyền quá nghiêm ngặt, và việc hạn chế quyền tiếp cận tri thức của nhân loại như vậy khiến tất cả tụt lại phía sau chỉ vì lợi ích của một nhóm rất nhỏ
- Tôi hoàn toàn ủng hộ việc tháo rời luật bản quyền thành từng mảnh. Nhưng cho đến khi làm vậy, các công ty như Meta cũng phải được đối xử y như mọi người khác
  Tức là cần kiện tụng, án tù và tiền phạt hàng triệu đô la. Đó mới chỉ là phần vi phạm bản quyền, còn có cả phần nói dối và gian lận nữa
  Điều thú vị là một dự án LLM ở Hà Lan đã bị yêu cầu dừng sau khi nhóm vận động bản quyền địa phương biết rằng nó được huấn luyện bằng một đống ebook lậu. Thật tiếc là chuyện đó không được tranh tụng tại tòa, và tôi cũng muốn xem liệu nhóm vận động đó có thể kéo ChatGPT cùng các công ty AI khác đã làm điều tương tự xuống hay không
- Điều đáng lo hơn là, điều tốt nhất mà những người được trả lương cao đến vậy nghĩ ra rốt cuộc vẫn chỉ là tải torrent giống hệt những người khác
  Có nguồn lực hàng chục tỷ đô la, chẳng lẽ không ai muốn dùng dù chỉ một phần trong đó để số hóa dữ liệu mới sao? Ngay cả Google cũng đã làm vậy
- “Những người Internet điên rồ ngày xưa” là đang nói đến Electronic Frontier Foundation à? https://www.eff.org/issues/innovation
- Một trong những điều lớn nhất tôi học được khi lớn lên là có thể sống an toàn khi tin rằng “ai cũng hành động vì lợi ích của mình”
  Những người thực sự giữ vững lý tưởng dù gây hại cho cuộc sống của chính họ hiếm đến mức khó tin
Ngoài việc tải xuống và phân phối bất hợp pháp nội dung có bản quyền, bài viết còn nói rằng có vẻ các nhân viên Meta đã nói dối về việc đó trong lời khai
Có khả năng bao gồm cả chính Mark Zuckerberg
- CEO của một công ty công nghệ lớn đã nói dối chúng ta ư?
  Phản ứng này hơi nhẹ nhàng, nhưng quá nhiều người thờ phụng bàn thờ của những người tạo việc làm và tin rằng những người như vậy là công dân đạo đức và tốt đẹp
Nếu tôi tải torrent và seed thì dù chỉ nhằm mục đích giải trí cá nhân chứ không phải thương mại, các chủ sở hữu bản quyền lớn vẫn sẽ truy đuổi tôi
Khi Meta làm thì ổn vì họ có luật sư giỏi hơn sao? Đây có thể trở thành một án lệ thú vị
- Án lệ kiểu đó chỉ kéo dài một hệ thống mà trong đó chỉ những người đủ tiền thuê luật sư mới được hưởng lợi
Ngay lúc này tôi nghĩ đến Aaron Swartz
- Trường hợp đó là các bài báo khoa học, nên xét về mặt tranh luận cũng có thể coi là vô hại hơn
- Aaron có muốn chúng ta tải tài liệu về để huấn luyện AI không?

Meta phân phối torrent và seed bộ dữ liệu 81.7TB chứa dữ liệu có bản quyền

Các email được giải mật hé lộ trọng tâm vụ kiện

Quy mô torrent và nguồn dữ liệu

Việc seed ảnh hưởng thế nào đến cáo buộc xâm phạm trực tiếp

Lo ngại pháp lý trong các tin nhắn nội bộ

Nghi vấn che giấu việc seed và phản ứng của Meta

Lập luận sử dụng hợp lý và các bước tố tụng còn lại

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News