3 điểm bởi GN⁺ 2025-03-24 | 2 bình luận | Chia sẻ qua WhatsApp
  • Mozilla.ai tin rằng trí tuệ nhân tạo (AI) mang lại nhiều cơ hội để củng cố cộng đồng thông qua hợp tác mở.
  • Những cơ hội này cần được thiết kế cẩn trọng, trong bối cảnh ngày càng gia tăng lo ngại về việc lạm dụng AI.
  • Trên nền tảng đó, dự án đã phát triển và ra mắt OpenStreetMap AI Helper Blueprint.
  • Vì sao là OpenStreetMap?
    • Dữ liệu là một thành phần quan trọng của các ứng dụng AI, và OpenStreetMap có một cộng đồng năng động đang duy trì cơ sở dữ liệu bản đồ mở đầy đủ nhất.
    • OpenStreetMap cung cấp nhiều loại dữ liệu như đường sá, ga tàu và nhiều thông tin khác; khi kết hợp với ảnh vệ tinh, nó mở ra những khả năng gần như vô hạn để huấn luyện nhiều mô hình AI khác nhau.
    • Mục tiêu là dùng AI để tăng tốc những phần chậm của quá trình lập bản đồ, đồng thời vẫn giữ khâu xác minh của con người ở những phần quan trọng.
  • Vì sao là thị giác máy tính?
    • Nhiều đối tượng trên bản đồ được biểu diễn bằng đa giác, và việc tìm cũng như vẽ chúng tốn rất nhiều thời gian.
    • Các mô hình thị giác máy tính có thể thực hiện những công việc này khá dễ dàng nếu được cung cấp đủ dữ liệu.
    • Dự án sử dụng các mô hình YOLOv11 và SAM2 để thực hiện phát hiện đối tượng và phân đoạn; các mô hình này nhẹ, nhanh và thân thiện với môi trường chạy cục bộ.
  • OpenStreetMap AI Helper Blueprint
    • Bước 1: Tạo bộ dữ liệu phát hiện đối tượng từ OpenStreetMap
      • Kết hợp dữ liệu OpenStreetMap với ảnh vệ tinh và chuyển đổi sang định dạng phù hợp cho huấn luyện.
      • Sử dụng Nominatim API và Overpass API để tải dữ liệu của khu vực quan tâm, rồi lưu theo định dạng Ultralytics YOLO.
    • Bước 2: Fine-tune mô hình phát hiện đối tượng
      • Fine-tune mô hình YOLOv11 và tải lên Hugging Face Hub.
    • Bước 3: Đóng góp cho OpenStreetMap
      • Dùng mô hình đã fine-tune để chạy suy luận trên nhiều tile, sau đó xác minh thủ công các đối tượng mới trước khi tải lên OpenStreetMap.
  • Suy nghĩ kết lại
    • OpenStreetMap là một ví dụ mạnh mẽ về hợp tác mở trong việc xây dựng bản đồ thế giới do cộng đồng dẫn dắt.
    • OpenStreetMap AI Helper Blueprint cho thấy AI có thể nâng cao đóng góp của con người, đồng thời nhấn mạnh giá trị của dữ liệu chất lượng cao.
    • Khi dùng Blueprint, có thể lập bản đồ số lượng bể bơi nhiều gấp khoảng 5 lần so với làm thủ công trong cùng một khoảng thời gian.
    • Dự án khuyến khích thử nghiệm huấn luyện mô hình cho các đối tượng bản đồ khác, cũng như đóng góp hoặc mở rộng dự án.

2 bình luận

 
depth221 2025-03-24

Tôi thấy rằng Map Feature thường được dịch là đối tượng bản đồ.

 
GN⁺ 2025-03-24
Ý kiến Hacker News
  • Xin chào từ OpenStreetMap Foundation. Không nên thêm trực tiếp các đối tượng do AI phát hiện vào cơ sở dữ liệu

    • Các thuật toán có vấn đề phát hiện nhầm và vấn đề vẽ các đối tượng đường thẳng hoặc hình chữ nhật theo kiểu rung lắc
    • Đây là công cụ hữu ích để phát hiện các đối tượng còn thiếu, nhưng cần có con người can thiệp để xác nhận rằng các đối tượng được phát hiện đã được vẽ đúng
    • Có thể xem hướng dẫn liên quan trên wiki OpenStreetMap
  • Sau khi phát hiện bể bơi, tôi cũng muốn thử phát hiện pin mặt trời

    • Có nhiều ý kiến phản đối quan điểm rằng OSM có thể tiếp tục phát triển chỉ bằng lao động thủ công
    • Trong 10 năm tôi đã thực hiện 60.000 thay đổi, nhưng chỉ với nhiệt huyết của các tình nguyện viên con người thì không thể giải quyết việc lập bản đồ ở quy mô toàn cầu
    • Cần một framework có thể mở rộng để chú thích chất lượng dữ liệu, nguồn gốc, cách báo lỗi và hướng dẫn cho bên tiêu thụ dữ liệu
    • Ví dụ, khi muốn truy vấn “doanh nghiệp thuộc loại X được con người lập bản đồ trong 1 năm qua”, hiện có thể làm phần nào bằng “ngày kiểm tra”
    • Nhưng không thể biết độ chính xác của thuộc tính, hoặc liệu người lập bản đồ chỉ xác nhận tên/vị trí hay không
    • Có lẽ sẽ tốt hơn nếu thu thập giờ mở cửa của mọi địa điểm để tự động duy trì dữ liệu hằng tháng
    • Với tư cách là người tiêu thụ dữ liệu, sẽ tốt hơn nếu có thể chỉ lọc các nguồn cụ thể đáng tin cậy
    • Ngay cả khi có những hạn chế như POI được AI suy luận, dữ liệu đó vẫn có thể sử dụng được
  • Sau khi trực tiếp trải nghiệm lập bản đồ tự động, tôi trở nên rất cảnh giác

    • Tôi đã đi du lịch bằng xe máy ở Nam Mỹ, và trên OSM có rất nhiều chỉnh sửa trông như được tự động hóa, khiến nó gần như không thể dùng được ở một số khu vực
    • Không chỉ ở các con đường nông thôn mà còn xảy ra cả ở những thành phố khá lớn
  • Tôi từng làm việc trong lĩnh vực này vài năm trước

    • Đã có rất nhiều mô hình, bộ dữ liệu, công cụ hiện có
    • Có thể xem tài liệu liên quan trên GitHub
  • Chúng ta không lập bản đồ những gì nhìn thấy trên ảnh vệ tinh, mà đang lập bản đồ thông tin thực tế trên mặt đất

    • Không nên đóng góp những gì AI tưởng tượng ra
  • Google không cho phép điều này, nhưng Mapbox cho phép nếu dùng cho mục đích phi thương mại hoặc cho OSM

    • Có thể dùng ảnh vệ tinh của Mapbox để tạo các bộ dữ liệu vector phái sinh
  • Tôi ước Mozilla tập trung vào việc tạo ra một trình duyệt tốt

  • Vài tháng trước tôi đã làm một việc tương tự (dữ liệu địa lý quy mô nhỏ)

    • Có thể xem tài liệu liên quan trên GitHub
  • Tôi muốn xem chi tiết về cách tinh chỉnh SAM/2 để phát hiện bể bơi hoặc các cụm pin mặt trời

    • Điều này hữu ích cho các dự án tăng cường khả năng chống chịu của cộng đồng, nhưng tôi không theo kịp phần tinh chỉnh SAM2
    • Mô hình Yolov8 tìm và phân đoạn pin mặt trời khá tốt, nhưng phần biên rất tệ nên cần rất nhiều công sức
    • Kết quả được huấn luyện với SAM2 trông tốt hơn nhiều
    • Tôi sẽ không thêm nó vào OSM vì vấn đề độ chính xác, nhưng có thể dùng ở nơi khác
  • Chúng tôi từng gọi việc này là “số hóa heads-up”