Giới thiệu về en.osm.town
- en.osm.town là một phần của mạng xã hội phân tán dựa trên Mastodon
- Là cộng đồng độc lập của cộng đồng OpenStreetMap, nhận tài trợ từ OpenStreetMap Foundation
- Thống kê máy chủ: 257 người dùng hoạt động
Nội dung chính
- Grant Slater đề xuất các công ty AI đừng âm thầm scrape dữ liệu OpenStreetMap mà hãy quyên góp $10.000
- Nếu quyên góp $50.000 thì cũng có thể cung cấp cập nhật streaming theo thời gian thực
- Bart Louwers nhắc rằng việc scrape OpenStreetMap là chuyện rất phổ biến
- wikiyu cho rằng sử dụng dữ liệu
planet.osm sẽ hiệu quả hơn
- Josua chỉ trích việc AI đang được huấn luyện theo cách kém hiệu quả
- Juan Luis đề cập rằng Read the Docs cũng đang gặp vấn đề tương tự về việc lạm dụng AI crawler
- Simon Poole cho rằng một cách làm hợp lý có thể tránh làm tổn hại hình ảnh của các công ty AI
- Michał nêu khả năng rằng các nhà thầu ở một số quốc gia có thể đã được giao nhiệm vụ tải dữ liệu OSM
- leadingzero chỉ trích rằng các yêu cầu giấy phép của OSM không được thực thi đúng cách
- Grant Slater cho biết ông đã tạo một kho GitHub để theo dõi thuộc tính tile
- Guillaume Rischard cho biết gần đây đã giải quyết một vấn đề pháp lý ở Đức
- Adderall girl grindset (Jes) đề xuất chặn các AI crawler
Tóm tắt của GN⁺
- Bài viết này đề cập đến vấn đề các công ty AI scrape dữ liệu OpenStreetMap
- Đề xuất cách sử dụng dữ liệu OpenStreetMap hiệu quả hơn và cách tiếp cận dữ liệu thông qua việc quyên góp
- Thảo luận về vấn đề lạm dụng AI crawler và các biện pháp đối phó
- Các dự án có chức năng tương tự gồm Google Maps và Bing Maps
1 bình luận
Ý kiến trên Hacker News
docker runđơn giảnplanet.osmlên torrent và chỉ cho phép scraping qua torrent có thể giúp phân tán tải mạng