3 điểm bởi GN⁺ 2025-02-08 | 1 bình luận | Chia sẻ qua WhatsApp
  • Nghi vấn Meta torrent trái phép

    • Các email được công bố gần đây được đưa ra như bằng chứng quan trọng trong vụ kiện bản quyền cáo buộc Meta đã huấn luyện mô hình AI bằng sách lậu một cách bất hợp pháp.
    • Meta thừa nhận đã torrent một bộ dữ liệu gây tranh cãi có tên LibGen, bao gồm hàng chục triệu cuốn sách lậu.
    • Meta đã torrent ít nhất 81,7 terabyte dữ liệu từ nhiều thư viện ngầm thông qua Anna’s Archive, trong đó 35,7 terabyte được lấy từ Z-Library và LibGen.
    • Các tác giả cho rằng hành vi sao chép dữ liệu bất hợp pháp của Meta là cực kỳ nghiêm trọng, đồng thời nhấn mạnh rằng ngay cả lượng vi phạm bản quyền nhỏ cũng có thể dẫn đến điều tra hình sự.
  • Các tác giả mở rộng giả thuyết về việc phân phối

    • Yêu cầu cung cấp thông tin về việc Meta torrent và seed đã bị từ chối, nhưng các tác giả đã tự thu thập chứng cứ.
    • Kỹ sư nghiên cứu của Meta, Nikolay Bashlykov, bày tỏ lo ngại rằng “torrent trên laptop công ty là không ổn”.
    • Bashlykov đã trực tiếp trao đổi với bộ phận pháp lý và nhấn mạnh rằng việc sử dụng torrent có thể là bất hợp pháp.
  • Nghi vấn Meta che giấu việc seed

    • Các tin nhắn nội bộ được công bố cho thấy Meta đã cố che giấu việc seed bằng cách tải dữ liệu mà không dùng máy chủ Facebook.
    • Michael Clark, người phụ trách quản lý dự án, đã đề cập đến việc thay đổi cấu hình để giảm thiểu việc seed.
    • Các tác giả cho rằng thông tin mới mâu thuẫn với lời khai trước đó và yêu cầu tái điều tra những người liên quan.
    • Mark Zuckerberg khẳng định ông không liên quan đến quyết định sử dụng LibGen, nhưng các email cho thấy ông có dính líu.
  • Phản ứng pháp lý của Meta

    • Meta lập luận trước tòa rằng việc huấn luyện AI là sử dụng hợp lý, đồng thời cho rằng sách của các tác giả thực tế không bị phân phối.
    • Meta đang chuẩn bị phản ứng pháp lý trước các cáo buộc vi phạm bản quyền.

1 bình luận

 
GN⁺ 2025-02-08
Ý kiến trên Hacker News
  • YouTube, Google và Spotify đều đã phát triển trong giai đoạn đầu bằng cách vi phạm bản quyền. Các công ty vừa bảo vệ quyền sở hữu trí tuệ của mình, vừa dễ dàng xâm phạm quyền của người khác. Cá nhân không có đặc quyền như vậy, và những người cố gắng tuân thủ pháp luật cuối cùng lại chịu thiệt

  • Khuyến nghị nên đọc bài diễn văn của Thomas Babington Macaulay về bản quyền. Việc kéo dài thời hạn bản quyền thường chỉ mang lại lợi ích cho các nhà xuất bản

  • Rõ ràng Meta đã huấn luyện LLM bằng tài liệu có bản quyền. Ngay trong bài báo của họ cũng thừa nhận điều này. Cần có tranh luận pháp lý về việc liệu có được phép huấn luyện mô hình AI bằng tài liệu có bản quyền hay không

  • Libgen nên được ủng hộ như một dự án văn minh của nhân loại, chứ không nên bị trừng phạt. Trong tương lai, chúng ta sẽ nhận ra mình đã ngu ngốc đến mức nào

  • Nhiều người chỉ trích các tập đoàn lớn, đặc biệt là Meta, và yêu cầu trừng phạt, nhưng sửa đổi luật sở hữu trí tuệ sẽ khôn ngoan hơn

  • Trước đây, người dùng internet cho rằng luật bản quyền quá hà khắc, và lập luận rằng nó hạn chế tri thức của nhân loại vì lợi ích của một thiểu số

  • Tôi chưa từng dùng Meta AI, và cũng chưa thấy ai xung quanh mình dùng nó. Rất khó hiểu ROI của Meta là gì

  • Có bài viết cho rằng nhân viên Meta đã nói dối về việc tải xuống và phát tán trái phép nội dung có bản quyền

  • Việc các tập đoàn lớn "tải xuống ô tô" thì được chấp nhận, nhưng nếu cá nhân làm vậy thì lại thành vấn đề