1 điểm bởi GN⁺ 2023-12-29 | 1 bình luận | Chia sẻ qua WhatsApp

New York Times đệ đơn kiện bản quyền chống lại OpenAI

  • New York Times đã đệ đơn kiện vi phạm bản quyền nhằm vào OpenAI và đối tác của họ là Microsoft.
  • New York Times đưa ra bằng chứng cho thấy các hệ thống dựa trên GPT do OpenAI phát triển có thể tái tạo các bài báo của New York Times.
  • New York Times quyết định khởi kiện OpenAI về vấn đề cấp phép sau khi đàm phán không diễn ra suôn sẻ.

Báo chí là lĩnh vực tốn kém

  • New York Times chi nhiều chi phí để thực hiện các hoạt động báo chí điều tra quan trọng thông qua đội ngũ phóng viên ở nhiều lĩnh vực khác nhau.
  • Tờ báo tạo doanh thu thông qua paywall mạnh và hạn chế việc sử dụng tác phẩm của mình bằng thông báo bản quyền cùng điều khoản sử dụng.
  • Đơn kiện cho rằng các công cụ do OpenAI phát triển đang xâm phạm các phương thức tạo doanh thu này.

Không chỉ là huấn luyện

  • Đã có nhiều vụ kiện được đệ trình liên quan đến việc sử dụng tài liệu có bản quyền để huấn luyện các hệ thống AI.
  • Vụ kiện của New York Times cho thấy cách những tài liệu được hấp thụ trong quá trình huấn luyện có thể xuất hiện trở lại khi hệ thống được sử dụng.
  • Đơn kiện bao gồm các trường hợp GPT-4 gần như tái tạo nguyên văn các bài viết của New York Times.

Danh tiếng và các thiệt hại khác

  • Đơn kiện chỉ ra rằng các hiện tượng 'ảo giác' của AI có thể gây tổn hại đến danh tiếng của New York Times và ảnh hưởng tiêu cực đến sức khỏe con người.
  • Ngay cả trong các bài viết của Wirecutter thuộc sở hữu của New York Times, nội dung có bản quyền cũng bị sử dụng trái phép và các liên kết kiếm tiền bị loại bỏ.
  • Đơn kiện nhằm vào OpenAI và Microsoft với các cáo buộc như vi phạm bản quyền, vi phạm DMCA và vi phạm nhãn hiệu.

Ý kiến của GN⁺:

  • Bài viết này cho thấy rõ những vấn đề phát sinh khi sự phát triển của công nghệ AI xung đột với các khuôn khổ pháp lý hiện có như bản quyền.
  • Mối quan hệ căng thẳng giữa chủ sở hữu bản quyền và các nhà phát triển AI có thể châm ngòi cho những tranh luận pháp lý và đạo đức quan trọng liên quan đến tương lai của AI.
  • Việc các cơ quan truyền thông lớn như New York Times thực hiện hành động pháp lý đối với công nghệ AI có thể trở thành tiền lệ quan trọng trong việc thiết lập quy định và hướng dẫn cho cách AI tạo ra và phân phối nội dung.

1 bình luận

 
GN⁺ 2023-12-29
Ý kiến trên Hacker News
  • Câu hỏi liệu việc thu thập bài viết của New York Times (NYT) để tạo sản phẩm có thuộc phạm vi sử dụng hợp lý hay không

    • Đặt vấn đề liệu việc dùng các bài viết NYT được thu thập hợp pháp để tạo sản phẩm, rồi tóm tắt và viết lại chúng để cung cấp có trả phí, có được xem là sử dụng hợp lý hay không.
    • Nêu sự khác biệt với công cụ tìm kiếm: công cụ tìm kiếm không thay thế bản gốc mà chỉ cung cấp tham chiếu, trong khi sản phẩm tóm tắt có thể được dùng thay cho việc đăng ký NYT.
  • Dự đoán về vụ kiện bản quyền của NYT

    • Cho rằng các LLM (mô hình ngôn ngữ lớn) thế hệ tiếp theo sẽ chỉ được huấn luyện bằng dữ liệu "tổng hợp" không có bản quyền, nên sẽ không còn vấn đề vi phạm bản quyền.
    • Cho rằng Mỹ không thể ngăn cản tiến bộ công nghệ này và các quốc gia khác sẽ vượt lên trước.
    • Đưa ra quan điểm rằng luật bản quyền sẽ khó theo kịp do sự tiến hóa phức tạp của mô hình AI và tính không rõ ràng của nguồn dữ liệu.
  • Đánh giá việc ChatGPT/Bing Copilot sao chép tác phẩm của NYT

    • Cho rằng các trường hợp ChatGPT và Bing Copilot sao chép nguyên văn bài viết của NYT không thuộc phạm vi sử dụng hợp lý.
    • Vụ kiện lập luận rằng không chỉ việc sao chép đơn thuần, mà cả việc sao chép trái phép các bài báo để huấn luyện LLM cũng cấu thành vi phạm bản quyền.
    • Cho rằng trọng tâm nên là vấn đề pháp lý liệu mô hình có thể được xem là "mang tính chuyển đổi" hay không.
  • Lo ngại về "sử dụng hợp lý" được nêu ra trong vụ kiện

    • Bày tỏ lo ngại về nguy cơ một số ít công ty độc chiếm giá trị của Internet.
    • Mong muốn tòa án thiết lập các quy tắc cho lĩnh vực này.
  • Liên kết tài liệu vụ kiện bản quyền NYT và tóm tắt nội dung

    • Cung cấp liên kết đến tài liệu cho thấy rõ các trường hợp ChatGPT trích dẫn nguyên văn tài liệu có bản quyền.
    • Đặt câu hỏi cần biến đổi tài liệu có bản quyền đến mức nào thì bản quyền không còn được áp dụng nữa.
    • Thảo luận khả năng OpenAI có thể chặn việc rò rỉ tài liệu có bản quyền thông qua giao diện web.
  • Phê phán nhận thức của các nhà phát triển cho rằng LLM giống con người

    • Chỉ trích cách một số nhà phát triển xem việc LLM dùng bài viết NYT như tài liệu học tập là tương tự con người.
    • Chỉ ra rằng việc LLM phức tạp không làm thay đổi thực tế rằng nội dung có bản quyền đã được tích hợp vào mã nguồn.
  • Kỳ vọng kiếm tiền của các công ty nội dung

    • Cho rằng các công ty nội dung, bao gồm NYT, kỳ vọng thu phí khi nội dung của họ được dùng để huấn luyện LLM.
    • Nhắc đến việc Reddit, Discord, Twitter đang cân nhắc hoặc đã tiến hành bán nội dung cho mục đích huấn luyện AI.
  • Lập luận pháp lý của NYT về việc sử dụng LLM

    • Phân tích lập luận của NYT rằng cách LLM sử dụng trong huấn luyện cấu thành hành vi vi phạm bản quyền.
    • So sánh sự chỉ trích đối với các công ty lớn bán quyền truy cập LLM với thái độ khoan dung hơn khi sử dụng cho mục đích cá nhân hoặc nghiên cứu học thuật.
  • Dự đoán về việc sử dụng LLM trong tương lai

    • Cho rằng trong tương lai, khi LLM được tích hợp vào các thực thể máy móc tương tác với thế giới vật lý, việc đọc tài liệu có bản quyền sẽ trở thành bất hợp pháp.
    • Đưa ra quan điểm rằng robot sẽ không còn có thể ghi nhớ nội dung có bản quyền thông qua việc xem TV, đọc sách thư viện hoặc tìm kiếm trên Internet.
  • Ý kiến cho rằng LLM nên được xem là "tác phẩm mang tính chuyển đổi" và thuộc phạm vi sử dụng hợp lý

    • Nêu quan điểm cá nhân rằng LLM là tác phẩm mang tính chuyển đổi nên nên được xem là sử dụng hợp lý.
    • Bày tỏ sự quan tâm đến việc hệ thống pháp lý sẽ đưa ra phán quyết như thế nào.