5 điểm bởi GN⁺ 2026-03-08 | 1 bình luận | Chia sẻ qua WhatsApp
  • Meta cho rằng việc tải xuống và tải lên sách lậu qua BitTorrent để huấn luyện mô hình AI thuộc phạm vi sử dụng hợp lý
  • Công ty giải thích rằng chức năng tải lên của BitTorrent là một quá trình về mặt kỹ thuật không thể tránh khỏi, đồng thời là phương thức duy nhất và hiệu quả để thu thập dữ liệu
  • Phía các tác giả chỉ ra vi phạm thủ tục, cho rằng lập luận bào chữa mới về sử dụng hợp lý đã được nộp sau thời hạn tố tụng, nhưng Meta phản bác rằng họ đã nêu rõ lập luận bào chữa này từ trước
  • Meta cũng nhấn mạnh rằng các tác giả chưa chứng minh được mô hình AI của hãng sao chép nội dung sách hoặc gây thiệt hại cho thị trường
  • Tranh cãi lần này đang được chú ý như một án lệ then chốt phân định ranh giới giữa việc thu thập dữ liệu huấn luyện AI và bản quyền

Lập luận sử dụng hợp lý của Meta và bối cảnh

  • Meta cùng các công ty công nghệ khác đã thu thập sách qua BitTorrent từ các thư viện bóng tối như Anna’s Archive để dùng cho việc huấn luyện mô hình AI
    • Trong quá trình này, nhiều tác giả đã đệ đơn kiện tập thể vào năm 2023 với lý do tác phẩm của họ bị sử dụng mà không có sự cho phép của chủ sở hữu bản quyền
    • Nguyên đơn bao gồm Richard Kadrey, Sarah Silverman, Christopher Golden và những người khác
  • Vào mùa hè năm 2025, tòa án phán quyết rằng bản thân việc sử dụng sách lậu làm dữ liệu huấn luyện thuộc phạm vi sử dụng hợp lý
    • Tuy nhiên, hành vi tải xuống và tải lên qua BitTorrent vẫn chưa được đưa ra phán quyết

Lập luận sử dụng hợp lý đối với việc tải lên trên BitTorrent

  • Gần đây Meta đã nộp văn bản trả lời bổ sung lên tòa án liên bang California, cho rằng hành vi tải lên cũng nằm trong phạm vi sử dụng hợp lý
    • Về mặt cấu trúc, BitTorrent là công nghệ mà khi tải tệp xuống sẽ tự động tải lên một phần dữ liệu cho người khác
    • Vì vậy, tải lên không phải là lựa chọn mà là chức năng bản chất của giao thức
  • Meta nêu rõ rằng vì bộ dữ liệu của Anna’s Archive chỉ được cung cấp dưới dạng torrent, nên họ không còn cách nào khác ngoài việc dùng BitTorrent
    • Trích lời luật sư: đây là phương thức hiệu quả và đáng tin cậy để có được bộ dữ liệu
    • Quá trình tải lên được xem là bước bắt buộc để phục vụ mục đích sử dụng hợp lý mang tính biến đổi là huấn luyện AI

Phản ứng của phía tác giả và tranh cãi về thủ tục

  • Phía tác giả đã gửi thư phản đối lên tòa, cho rằng Meta đã bổ sung một lập luận bào chữa mới sau thời hạn tố tụng
    • Họ cho rằng dù Meta đã biết về vấn đề liên quan đến tải lên từ tháng 11/2024, công ty vẫn không đưa ra lập luận bào chữa về sử dụng hợp lý
    • Họ cũng nhấn mạnh rằng quy định liên bang (Rule 26(e)) đặt ra nghĩa vụ bổ sung chứng cứ, nhưng không phải là một “kẽ hở” để thêm lập luận bào chữa mới
  • Đáp lại, Meta phản bác rằng họ đã nêu rõ lập luận bào chữa này trong tài liệu quản lý vụ việc chung vào tháng 12/2025
    • Meta cũng cho rằng luật sư phía tác giả khi đó đã đề cập đến điểm này trước tòa

Lời khai của tác giả và vấn đề thiệt hại thị trường

  • Meta trích dẫn lời khai của các tác giả để nhấn mạnh rằng không có thiệt hại thị trường
    • Tất cả các nguyên đơn đều khai rằng họ không biết trường hợp nào nội dung sách của mình bị tái tạo trong đầu ra của mô hình Meta
    • Sarah Silverman làm chứng rằng: “nếu mô hình không xuất ra nội dung cuốn sách thì tôi không bận tâm”
  • Từ đó, Meta lập luận rằng các tác giả không chứng minh được thiệt hại thực tế hoặc sụt giảm doanh số
    • Vì vậy, công ty cho rằng vụ kiện này chỉ đang nhắm vào chính quá trình huấn luyện, hơn là bảo vệ sách

Năng lực cạnh tranh AI của Mỹ và các điểm tranh chấp sắp tới

  • Trong văn bản trả lời, Meta nhấn mạnh rằng đầu tư vào AI và việc sử dụng dữ liệu đã củng cố vị thế dẫn đầu AI toàn cầu của Mỹ
    • Theo họ, những tiến bộ công nghệ như vậy xứng đáng được bảo vệ như một tài sản quốc gia
  • Trong thời gian tới, tòa sẽ phải quyết định có công nhận lập luận ‘sử dụng hợp lý do tính tất yếu về mặt kỹ thuật’ hay không
    • Phán quyết lần này có thể trở thành tiền lệ quan trọng để xác định ranh giới giữa việc thu thập dữ liệu huấn luyện AI và bản quyền
  • Vấn đề còn lại hiện nay là liệu hành vi phân phối qua BitTorrent có cấu thành xâm phạm trực tiếp hay không, và quyết định của thẩm phán đang được theo dõi sát sao

1 bình luận

 
GN⁺ 2026-03-08
Ý kiến trên Hacker News
  • Nhớ lại thời RIAA từng kiện trẻ con vì tải album Metallica qua chia sẻ tệp
    Họ đòi 100.000 USD cho mỗi bài hát, một con số vô lý nếu nghĩ rằng thiệt hại khi ăn cắp một chiếc CD vật lý chỉ vào khoảng 1 USD mỗi bài
    Tòa án lại xem con số đó là nghiêm túc, và dù thường dàn xếp ở mức khoảng 3.000 USD thì vẫn cao gấp 30 lần thiệt hại thực tế
    Ngay cả khi bản nháp của phim Wolverine bị rò rỉ, mức tối đa có thể đòi theo luật cũng chỉ là 150.000 USD

    • Nhớ là chính các thành viên Metallica đã trực tiếp thúc đẩy những vụ kiện này
      Không chỉ RIAA hay hãng đĩa tàn nhẫn, mà chính Metallica đã chống lại người hâm mộ của mình
    • Dù vậy, nhờ thế mà đã có những phim hoạt hình Flash vui nhộn như Metallicops
      Liên kết YouTube
    • Vậy thì giờ nếu bị bắt vì tải media bằng BitTorrent, liệu có thể nói rằng “tôi dùng nó để huấn luyện mô hình cục bộ nên đây là fair use” hay không
    • Nhưng họ là tỷ phú. Châm biếm rằng đó là những người “cần được bảo vệ” nhất trong xã hội, còn trẻ con lại thành vật tế thần
    • Tự hỏi nếu bản quyền đã yếu như thế vào năm 2003 thì hẳn đã vui biết bao
      Nếu kiểu thay đổi này được áp dụng không chỉ cho doanh nghiệp mà cả người bình thường, mức độ cản trở xã hội tiến bộ của bản quyền sẽ giảm đi
      Sự suy yếu của bản quyền có thể dẫn tới giải phóng đổi mới sáng tạo
      Bản quyền là “luật hạn chế quyền sao chép chỉ cho một nhóm nhất định”, và nhìn từ xa thì nó thật sự giống một thiết chế phi lý
  • BitTorrent về bản chất sẽ tự động tải lên khi tải tệp xuống
    Tức là có ý kiến cho rằng upload không phải lựa chọn mà là bản chất của giao thức, nhưng có vẻ khó chứng minh điều đó trước tòa

    • Không hẳn là hoàn toàn tự động. Seeding là mặc định nhưng có thể tắt thủ công
      Đa số người dùng không đụng vào cài đặt nên họ seed mà không hề biết
      Tuy vậy giao thức tự thân không ép buộc điều đó, và vẫn có thể giới hạn upload về 0 hoặc nói dối với tracker
      Nghĩa là seeding gần với một chuẩn mực cộng đồng hơn là nghĩa vụ kỹ thuật
    • Ngạc nhiên là chưa từng thấy lập luận này được dùng trước tòa
      Nếu vậy thì liệu các vụ tải nhạc bằng BitTorrent trong quá khứ có cần được xét xử lại hay không
    • Dùng ví von “bắn súng làm người ta chết cũng chỉ là cách công nghệ vận hành” để chỉ trích việc đổ lỗi cho công nghệ là né tránh trách nhiệm
    • Kể cả nếu tòa chấp nhận lập luận đó, người dùng vẫn không thể trốn trách nhiệm nếu đã biết trước sự thật này
    • Nhắc lại rằng ngày xưa những người như vậy được gọi là leechers, kèm tranh xkcd liên quan
  • Trước đây không thể tưởng tượng các tập đoàn lớn lại đứng trước tòa với lập trường ủng hộ sao chép lậu như vậy
    Trong khi đó, những nhà hoạt động từng bảo vệ hành vi vi phạm bản quyền ngày trước giờ lại phản đối khi chính các tập đoàn lớn làm điều đó

    • Các nhà hoạt động và các tập đoàn đều có lợi ích khác nhau
      Có phe tin rằng “thông tin phải được tự do”, và có phe coi trọng “sinh kế của nghệ sĩ”
      Công ty AI và nhà xuất bản, dù đều là doanh nghiệp lớn, vẫn có cấu trúc lợi ích khác nhau
    • Lý do các nhà hoạt động phản đối là vì các tập đoàn lại tiếp tục bóc lột người sáng tạo cá nhân
      Nếu Meta torrent IP của Nintendo, hay OpenAI torrent IP của Netflix, có lẽ sẽ chẳng ai quan tâm
    • Ở nước tôi, mọi thiết bị lưu trữ bán ra đều bao gồm phí bồi hoàn bản quyền (Artisjus)
      Dù không sao chép gì thì tiền cũng đã trả rồi, nên về mặt đạo đức tôi không thấy tội lỗi khi tải lậu
      Theo logic đó, các công ty AI cũng không có tư cách than phiền về việc scrape dữ liệu
    • Những kẻ sao chép lậu ngày xưa đơn thuần làm vậy để giải trí, còn các tập đoàn lớn ngày nay thì ăn cắp để kiếm lời
      Bên trước vào tù, bên sau lại kiếm được tiền
    • Rốt cuộc dòng tiền vẫn chẳng khác xưa
      Tòa án chỉ như một diode chỉnh lưu, khiến nó chỉ chảy theo một hướng mà thôi
  • Tò mò không biết các tập đoàn lớn giờ có thể trực tiếp trả tiền cho những thư viện ngầm như Anna’s Archive để lấy quyền truy cập hay không
    Có tin đồn Nvidia đã làm vậy
    Với Meta thì vài chục nghìn USD là số tiền không đáng kể, nên nếu mọi chuyện đi theo hướng vụ Anthropic thì điều đó có thể xảy ra
    Dĩ nhiên tác giả vẫn có thể hỏi LLM về nội dung sách của mình, nhưng nếu bằng chứng ít đi thì khả năng khởi kiện cũng sẽ thấp hơn

    • Khẳng định rằng những giao dịch như vậy đã tồn tại
  • Lập luận lần này của Meta trông như một cái cớ khi bị dồn vào chân tường
    Khả năng tòa chấp nhận là thấp, và cuối cùng có lẽ vẫn sẽ khép lại bằng thỏa thuận dàn xếp tập thể
    Các nguyên đơn đại diện có thể nhận được khoản khá lớn, nhưng những tác giả còn lại có lẽ chỉ được vài đồng lẻ
    Nếu nguyên đơn là một công ty truyền thông lớn thì cuộc chiến này đã đắt đỏ hơn nhiều

  • Nếu Meta thực sự thành công với lập luận này, thì tôi cũng có thể ăn cắp sách rồi chia sẻ hay sao
    Tò mò liệu logic tương tự có áp dụng cho âm nhạc, phim ảnh và game hay không

    • Mỉa mai đáp lại rằng “chỉ Facebook mới làm được
  • Sớm muộn gì cũng phải giải quyết mâu thuẫn giữa lý tưởng “pháp luật công bằng” và thực tế “pháp luật bị quyền lực bẻ cong”

    • Tin xấu là vấn đề đó thật ra đã được giải quyết rồi
    • Việc Disney và các công ty khác dùng luật để tối đa hóa lợi ích của mình là một ví dụ bi thảm
      Xem Copyright Term Extension Act
    • Mỉa mai rằng bom hạt nhân sẽ rơi xuống trước khi họ chịu từ bỏ quyền lực
    • Pháp luật từ trước đến nay luôn là công cụ bạo lực của kẻ có quyền
      Kẻ yếu không tuân theo thì sẽ bị trừng phạt
    • Vì luật không phải khoa học mà là lĩnh vực của diễn giải, nên nó không thể hoàn toàn công bằng
      Ngay cả các khái niệm như “giết người”, “lừa đảo”, “trộm cắp” cũng mơ hồ
      Theo họ, giải pháp duy nhất là giáo dục công dân tốt hơn
  • Khá bất ngờ khi Meta lại chịu theo đuổi vụ kiện này đến cùng
    Dù lập luận nghe có vẻ nực cười, nhưng từ góc nhìn doanh nghiệp thì vi phạm luật rồi nộp phạt
    lại rẻ hơn việc tuân thủ luật và đánh mất lợi nhuận
    Cuối cùng, ngay cả chi phí kiện tụng kiểu này cũng sẽ được hạch toán như một phần chi phí kinh doanh

  • Vào thập niên 90 đến 2000, FBI từng truy quét những người vô gia cư bán VHS/DVD lậu trên đường phố

    • Cho rằng ở Mỹ, tội ác thật sự là nghèo
    • Hồi đó ICE từng lần theo chuỗi cung ứng của những vụ này, điều mà giờ nhìn lại thấy khá ngây thơ
      Dù vậy họ không dính đến các tội như bóc lột trẻ em
      Đặt câu hỏi rằng nếu ngày nay ICE hay FBI phát hiện một vụ như vậy, thì họ sẽ gọi cho ai trước
  • Tòa án đánh mất sự tôn trọng khi trở nên thiếu nhất quán, luôn đối xử với pháp nhân (doanh nghiệp) như con người
    trong khi lại đối xử với con người thật hay các sinh vật sống khác như hàng hóa
    Cần có một cách tốt hơn để duy trì trật tự và tiến bộ