- Mozilla.ai tin rằng trí tuệ nhân tạo (AI) mang lại nhiều cơ hội để củng cố cộng đồng thông qua hợp tác mở.
- Những cơ hội này cần được thiết kế cẩn trọng, trong bối cảnh ngày càng gia tăng lo ngại về việc lạm dụng AI.
- Trên nền tảng đó, dự án đã phát triển và ra mắt OpenStreetMap AI Helper Blueprint.
- Vì sao là OpenStreetMap?
- Dữ liệu là một thành phần quan trọng của các ứng dụng AI, và OpenStreetMap có một cộng đồng năng động đang duy trì cơ sở dữ liệu bản đồ mở đầy đủ nhất.
- OpenStreetMap cung cấp nhiều loại dữ liệu như đường sá, ga tàu và nhiều thông tin khác; khi kết hợp với ảnh vệ tinh, nó mở ra những khả năng gần như vô hạn để huấn luyện nhiều mô hình AI khác nhau.
- Mục tiêu là dùng AI để tăng tốc những phần chậm của quá trình lập bản đồ, đồng thời vẫn giữ khâu xác minh của con người ở những phần quan trọng.
- Vì sao là thị giác máy tính?
- Nhiều đối tượng trên bản đồ được biểu diễn bằng đa giác, và việc tìm cũng như vẽ chúng tốn rất nhiều thời gian.
- Các mô hình thị giác máy tính có thể thực hiện những công việc này khá dễ dàng nếu được cung cấp đủ dữ liệu.
- Dự án sử dụng các mô hình YOLOv11 và SAM2 để thực hiện phát hiện đối tượng và phân đoạn; các mô hình này nhẹ, nhanh và thân thiện với môi trường chạy cục bộ.
- OpenStreetMap AI Helper Blueprint
- Bước 1: Tạo bộ dữ liệu phát hiện đối tượng từ OpenStreetMap
- Kết hợp dữ liệu OpenStreetMap với ảnh vệ tinh và chuyển đổi sang định dạng phù hợp cho huấn luyện.
- Sử dụng Nominatim API và Overpass API để tải dữ liệu của khu vực quan tâm, rồi lưu theo định dạng Ultralytics YOLO.
- Bước 2: Fine-tune mô hình phát hiện đối tượng
- Fine-tune mô hình YOLOv11 và tải lên Hugging Face Hub.
- Bước 3: Đóng góp cho OpenStreetMap
- Dùng mô hình đã fine-tune để chạy suy luận trên nhiều tile, sau đó xác minh thủ công các đối tượng mới trước khi tải lên OpenStreetMap.
- Suy nghĩ kết lại
- OpenStreetMap là một ví dụ mạnh mẽ về hợp tác mở trong việc xây dựng bản đồ thế giới do cộng đồng dẫn dắt.
- OpenStreetMap AI Helper Blueprint cho thấy AI có thể nâng cao đóng góp của con người, đồng thời nhấn mạnh giá trị của dữ liệu chất lượng cao.
- Khi dùng Blueprint, có thể lập bản đồ số lượng bể bơi nhiều gấp khoảng 5 lần so với làm thủ công trong cùng một khoảng thời gian.
- Dự án khuyến khích thử nghiệm huấn luyện mô hình cho các đối tượng bản đồ khác, cũng như đóng góp hoặc mở rộng dự án.
2 bình luận
Tôi thấy rằng
Map Featurethường được dịch là đối tượng bản đồ.Ý kiến Hacker News
Xin chào từ OpenStreetMap Foundation. Không nên thêm trực tiếp các đối tượng do AI phát hiện vào cơ sở dữ liệu
Sau khi phát hiện bể bơi, tôi cũng muốn thử phát hiện pin mặt trời
Sau khi trực tiếp trải nghiệm lập bản đồ tự động, tôi trở nên rất cảnh giác
Tôi từng làm việc trong lĩnh vực này vài năm trước
Chúng ta không lập bản đồ những gì nhìn thấy trên ảnh vệ tinh, mà đang lập bản đồ thông tin thực tế trên mặt đất
Google không cho phép điều này, nhưng Mapbox cho phép nếu dùng cho mục đích phi thương mại hoặc cho OSM
Tôi ước Mozilla tập trung vào việc tạo ra một trình duyệt tốt
Vài tháng trước tôi đã làm một việc tương tự (dữ liệu địa lý quy mô nhỏ)
Tôi muốn xem chi tiết về cách tinh chỉnh SAM/2 để phát hiện bể bơi hoặc các cụm pin mặt trời
Chúng tôi từng gọi việc này là “số hóa heads-up”