The New York Times kiện OpenAI và Microsoft vì cáo buộc vi phạm bản quyền

(theverge.com)

3 điểm bởi GN⁺ 2023-12-28 | 2 bình luận | Chia sẻ qua WhatsApp

The New York Times đã kiện OpenAI và Microsoft vì cáo buộc vi phạm bản quyền
Tờ báo này cho rằng các công ty đã sao chép hàng triệu bài viết của The New York Times để huấn luyện các mô hình ngôn ngữ vận hành ChatGPT và Copilot
Việc này được cho là đã làm tổn hại mối quan hệ của The New York Times với độc giả, đồng thời làm giảm doanh thu từ thuê bao, cấp phép, quảng cáo và liên kết

Nội dung các cáo buộc trong đơn kiện

Theo đơn kiện, các mô hình AI này trích dẫn nguyên văn nội dung của The New York Times, hoặc tóm tắt và bắt chước phong cách diễn đạt của báo, qua đó đe dọa nền báo chí chất lượng cao
The New York Times cho biết đã cố gắng đàm phán trong nhiều tháng nhưng không đạt được giải pháp
Người phát ngôn của OpenAI cho biết họ đang nỗ lực để các nhà sáng tạo nội dung có thể hưởng lợi từ công nghệ AI và các mô hình doanh thu mới

Ý kiến của GN⁺

Vụ việc này phản ánh một vấn đề hiện đại nơi sự phát triển của công nghệ AI va chạm với các vấn đề bản quyền.
Vụ kiện vi phạm bản quyền có thể khơi mào cho các thảo luận pháp lý và đạo đức quan trọng về cách AI nên sử dụng các tác phẩm do con người sáng tạo.
Việc một cơ quan báo chí lớn như The New York Times đối đầu với các công ty AI có thể trở thành bước ngoặt quan trọng đối với tương lai của công nghệ AI và việc bảo vệ quyền của các nhà sáng tạo nội dung.

2 bình luận

xguru 2023-12-29

Bài viết khác cho biết nội dung đơn kiện yêu cầu xóa mọi phiên bản GPT được huấn luyện bằng tư liệu của New York Times và tiêu hủy các tập dữ liệu đã dùng cho việc huấn luyện. Ngoài ra, họ cũng yêu cầu một lệnh cấm vĩnh viễn để ngăn chặn những hành vi tương tự trong tương lai.
Hơn nữa, đơn kiện còn bao gồm yêu cầu về một khoản chi phí khổng lồ. "Bồi thường thiệt hại theo luật định, bồi thường thiệt hại mang tính đền bù, hoàn trả, bồi thường trừng phạt và mọi biện pháp khắc phục khác được pháp luật hoặc lẽ công bằng cho phép"

GN⁺ 2023-12-28

Ý kiến Hacker News

Quan điểm ủng hộ New York Times (NYT)
- Có vẻ như các tổ chức sáng tạo một lần nữa đang bị tụt lại trong cạnh tranh, tương tự thời điểm các công cụ tìm kiếm hiện đại ra đời.
- Không chỉ trích quyết định ban đầu của OpenAI khi huấn luyện mô hình mà không có thỏa thuận cấp phép. Nếu không làm vậy, có thể cuộc cách mạng AI đã không xảy ra.
- Nhưng giờ đây, OpenAI cần thừa nhận khoản nợ đối với các nhà sáng tạo nội dung và khắc phục điều đó. Nếu không, họ có thể chịu tổn thất lớn hơn và tạo cơ hội cho đối thủ.
Cảm xúc phức tạp về LLM tiêu thụ nội dung có bản quyền rồi tái tạo thành nội dung mới
- Với tư cách là một lập trình viên phần mềm đồng thời là tác giả, sự phát triển của LLM rất thú vị nhưng cũng gây lo ngại khi các tác phẩm bị LLM sử dụng.
- Hiện tại, LLM giống với các trang web hạng thấp chuyên viết lại nội dung mà không có nghiên cứu gốc. Điều này có thể hợp pháp về mặt kỹ thuật nhưng là hành vi ký sinh không tạo thêm giá trị.
- Với giới chuyên môn, lỗi và việc thiếu trích dẫn của LLM là vấn đề; còn người dùng phổ thông sẽ dùng LLM để tạo nội dung ít công sức phục vụ SEO, điều này có thể dẫn tới chất lượng LLM suy giảm.
Hy vọng mở rộng phạm vi sử dụng hợp lý cho việc huấn luyện AI
- Việc sử dụng hợp lý cho huấn luyện AI quan trọng với tương lai nhân loại hơn là một cơ quan truyền thông đơn lẻ.
- Dù NYT biến mất thì vẫn có nhiều kênh thay thế, nhưng nếu AI bị tổn hại từ sớm vì tranh chấp sở hữu trí tuệ (IP), điều đó có thể cản trở những tiến bộ quan trọng.
Lập luận yếu về việc bắt chước phong cách New York Times và triển vọng tiêu cực cho OpenAI
- Việc xuất nguyên nội dung của New York Times là bất lợi cho OpenAI.
- Việc loại bỏ một nội dung cụ thể khỏi LLM là rất khó, và điều này cho thấy vòng đời của LLM có thể sẽ ngắn.
Việc ngăn chặn LLM dựa trên cáo buộc vi phạm bản quyền không thúc đẩy tiến bộ của khoa học và nghệ thuật hữu ích
- LLM cần được quản lý, nhưng cần một hình thức quản lý khác thay vì dựa vào bản quyền.
- Ý tưởng ban đầu mang tính mở của OpenAI là tốt, nhưng giờ đây cần có sự can thiệp của công chúng.
Chỉ trích việc một công ty độc chiếm toàn bộ sản phẩm do con người tạo ra
- Hành vi này ít nhất là trơ trẽn và sai trái, thậm chí có thể bị coi là đáng hổ thẹn.
- OpenAI có quá nhiều nạn nhân khiến việc kiện tụng trở nên phi thực tế, nên tòa án có thể sẽ quyết định trước rằng không bồi thường cho các nạn nhân.
Tính chính đáng của việc tự do truy cập nội dung công khai trên internet và việc máy móc sử dụng dữ liệu
- Nội dung mà con người có thể truy cập thì máy móc cũng nên có thể truy cập.
- Máy móc có thể làm thay những việc con người làm được, để con người dành thời gian cho những việc thú vị hơn.
So sánh hành vi ký sinh của LLM với patent troll
- LLM được huấn luyện bằng cách tận dụng các mẫu ngôn ngữ trong kho văn bản mà người sáng tạo không trực tiếp sử dụng.
- Điều này không mang lại lợi ích cho xã hội mà chỉ có lợi cho troll, và không có lý do gì để tòa án phải ép buộc điều đó.
Đề cập đến vụ New York Times kiện OpenAI và Microsoft
- New York Times cho rằng hai công ty này đã sao chép và sử dụng hàng triệu bài viết của họ để xây dựng các mô hình AI.