- Bài viết về sự phức tạp pháp lý và tính đạo đức giả xung quanh web scraping
- Cách các tập đoàn lớn như Meta và Microsoft cấm web scraping trên nền tảng của chính họ, trong khi đồng thời thu thập dữ liệu từ nền tảng của các công ty khác
- Sự phức tạp của các vấn đề pháp lý liên quan đến việc truy cập và sử dụng dữ liệu trên Internet, cũng như mục đích của việc đó. Có những dạng dữ liệu được bảo vệ bởi bản quyền hoặc các quyền sở hữu trí tuệ khác, nhưng phần lớn dữ liệu trên Internet không dễ được bảo vệ
- Các công ty mạng xã hội như LinkedIn và Facebook theo đuổi các vụ kiện về web scraping một cách quyết liệt nhất. Tuy nhiên, nội dung mà họ cố bảo vệ là do người dùng tạo ra, không phải tài sản của chính họ
- Trong giai đoạn đầu của Internet, các công ty đã sử dụng các học thuyết pháp lý để ngăn web scraping như một hành vi xâm nhập tài sản, tức cho rằng các yêu cầu dữ liệu hàng loạt không mong muốn là một dạng xâm phạm đối với tài sản hữu hình của cá nhân, cụ thể là máy chủ
- Từ đầu những năm 2000 đến năm 2017, Computer Fraud and Abuse Act (CFAA) là cơ sở pháp lý chính để ngăn web scraping. CFAA cấm truy cập trái phép vào "máy tính được bảo vệ"
- Trong vụ hiQ Labs, Inc. kiện LinkedIn Corp. năm 2017, quyền của web scraper trong việc truy cập dữ liệu LinkedIn công khai theo CFAA đã được xác nhận, và nhiều người diễn giải điều này như một quyền tích cực để scrape dữ liệu công khai
- Hiện nay, cách chính để ngăn web scraping là thông qua các cáo buộc vi phạm hợp đồng. Điều này cho phép các công ty khẳng định quyền sở hữu đối với việc sử dụng và truy cập dữ liệu thông qua luật hợp đồng
- Sự chuyển dịch từ luật tài sản sang luật hợp đồng cho phép chủ sở hữu website định nghĩa quyền đối với dữ liệu trực tuyến thông qua điều khoản sử dụng trực tuyến
- Bài viết nhấn mạnh sự đạo đức giả của các công ty như Microsoft. Gần đây họ đã cập nhật điều khoản sử dụng để cấm scraping các dịch vụ AI, nhưng công ty liên kết của họ là OpenAI lại tung ra sản phẩm được thiết kế để scrape toàn bộ Internet
- Tác giả chỉ trích việc tòa án cho phép các công ty tư nhân tạo ra quyền sở hữu trí tuệ thông qua các hợp đồng áp đặt, và cho rằng những quyết định như vậy lẽ ra phải là vấn đề thuộc về lợi ích công
- Bài viết cho rằng khuôn khổ pháp lý hiện tại về web scraping sẽ bị thử thách bởi các trường hợp generative AI, đồng thời dự đoán rằng tính nhất quán của pháp luật sẽ không thể được duy trì và sẽ có những diễn biến pháp lý quan trọng trong vài năm tới
1 bình luận
Ý kiến trên Hacker News