6 điểm bởi GN⁺ 2025-04-19 | 6 bình luận | Chia sẻ qua WhatsApp
  • Theo dõi vị trí dựa trên hình ảnh bằng ChatGPT đang lan rộng như một xu hướng viral
  • Các mẫu mới nhất của OpenAI là o3 và o4-mini kết hợp khả năng phân tích hình ảnh với tìm kiếm web để suy luận vị trí với độ chính xác cao
  • Người dùng đưa vào o3 thực đơn nhà hàng, cảnh đường phố, ảnh chân dung và nhiều loại ảnh khác để thử đoán vị trí như trò chơi "GeoGuessr"
  • Lo ngại xâm phạm quyền riêng tư đang gia tăng, và dù OpenAI cho biết có các biện pháp an toàn nhưng vẫn thiếu biện pháp ngăn chặn rõ ràng
  • OpenAI cho biết họ có hệ thống phát hiện và phản ứng với hành vi lạm dụng, nhưng vẫn có ý kiến cho rằng các giới hạn thực tế còn chưa đủ

Xu hướng truy ngược vị trí từ hình ảnh bằng ChatGPT

  • Gần đây, trong cộng đồng người dùng đang lan rộng xu hướng truy vị trí trong ảnh thông qua ChatGPT
  • Các mẫu mới o3 và o4-mini do OpenAI phát hành được trang bị khả năng suy luận thông tin thị giác trong ảnh
  • Ngay cả ảnh mờ hoặc bị méo cũng có thể được phân tích sau các bước tiền xử lý như cắt, xoay, phóng to
  • Khi kết hợp với tính năng tìm kiếm web, khả năng này cho thấy hiệu năng rất tốt trong suy luận vị trí của thành phố, địa danh, nhà hàng, quán bar và nhiều nơi khác

ChatGPT được dùng như GeoGuessr

  • Người dùng yêu cầu o3 "hãy hành xử như GeoGuessr" và thử ước đoán vị trí từ ảnh chụp màn hình story Instagram, ảnh đường phố, thực đơn và nhiều loại ảnh khác
    • GeoGuessr là một trò chơi trực tuyến nơi bạn tải ảnh lên và tìm vị trí
  • ChatGPT có thể suy ra vị trí chỉ từ các manh mối thị giác, ngay cả khi không có lịch sử trò chuyện trước đó hay siêu dữ liệu EXIF
  • Đặc biệt, o3 cho thấy hiệu năng vượt GPT-4o trong một số tình huống nhất định

    Ví dụ: khi xem ảnh một vật trang trí hình tê giác màu tím treo trong một quán bar tối

    • GPT-4o trả lời sai là "một quán pub ở Anh"
    • o3 suy luận chính xác là "một quán speakeasy ở Williamsburg"

GPT-4o cũng cho thấy độ chính xác đáng kinh ngạc

  • Trong bài kiểm tra do TechCrunch thực hiện, GPT-4o cũng cho thấy độ chính xác khá cao và tốc độ xử lý nhanh hơn
  • Tuy vậy, cũng có những trường hợp chỉ o3 mới xác định đúng được vị trí
  • Nhưng o3 cũng không hoàn hảo, và vẫn có những lúc không đưa ra được câu trả lời hoặc gợi ý một địa điểm hoàn toàn sai

Lo ngại về nguy cơ xâm phạm quyền riêng tư

  • Việc bất kỳ ai cũng có thể dùng ảnh của người khác để truy ra vị trí mà gần như không có ràng buộc nào là một vấn đề lớn
  • Ví dụ, việc chụp màn hình story Instagram có thể dẫn tới nguy cơ doxxing
  • Hiện tại, với các mẫu o3 và o4-mini, OpenAI không đề cập đến vấn đề này trong báo cáo an toàn chính thức

Lập trường chính thức của OpenAI

  • Vài giờ sau khi bài báo được đăng, OpenAI đã gửi cho TechCrunch tuyên bố sau:

    “o3 và o4-mini bổ sung năng lực suy luận thị giác vào ChatGPT,
    và có thể được sử dụng hữu ích trong các tình huống liên quan đến khả năng tiếp cận, nghiên cứu và ứng phó khẩn cấp.
    Chúng tôi đã huấn luyện hệ thống để từ chối các yêu cầu liên quan đến thông tin nhạy cảm,
    triển khai cơ chế ngăn chặn nhận diện cá nhân và giám sát lạm dụng,
    đồng thời chủ động phản ứng khi có hành vi vi phạm chính sách.”

  • Tuy nhiên, hiện vẫn thiếu các cơ chế chặn cụ thể hoặc biện pháp kiểm soát kỹ thuật đối với tính năng truy ngược vị trí

6 bình luận

 
ndrgrd 2025-04-19

Thực ra chỉ là máy tính làm thay phần phiền phức thôi; chẳng phải bản thân phương pháp này vốn đã tồn tại rồi sao?

 
kandk 2025-04-21

AI vốn là để làm những việc con người có thể làm mà. (giống như robot hút bụi)

 
unsure4000 2025-04-19

Thời gian và chi phí cần bỏ ra đã rẻ hơn hàng chục lần. Rõ ràng đây là một sự gia tăng mức độ đe dọa.

 
ndrgrd 2025-04-19

Đúng như bài viết nói, vì đây vốn đã là thứ được người ta tận hưởng dưới dạng một "trò chơi", nên trước đây nó cũng không phải ở mức quá khó để người bình thường tiếp cận.
Mối đe dọa xuất hiện khi bạn đăng lên những bức ảnh có thể dễ dàng bị xác định vị trí trong những tình huống mà lẽ ra không nên để lộ vị trí.

Ngay cả trước đó, như trong các bình luận trên Hacker News đã nói, việc đăng bất cứ thứ gì lên Internet công khai vốn dĩ đã là chuyện phải mặc định rằng thông tin sẽ bị lộ ra.

 
roxie 2025-04-20

Nhìn chung tôi đồng ý. Nhưng việc giờ đây bất kỳ ai cũng có thể làm điều đó chỉ trong chốc lát quả thật khiến người ta nghĩ đến không ít tác dụng phụ đáng sợ.

 
GN⁺ 2025-04-19
Ý kiến trên Hacker News
  • Có suy luận rằng "xe chạy tay lái bên trái, nhưng giao thông lưu thông bên trái", nhưng bức ảnh không đưa ra manh mối về việc xe cộ di chuyển theo hướng nào
  • Đối với ý kiến rằng "ngôn ngữ trên biển hiệu cửa hàng trông giống tên doanh nghiệp viết bằng bảng chữ cái Latinh hơn là tiếng Tây Ban Nha hay tiếng Bồ Đào Nha", thì tiếng Tây Ban Nha và tiếng Bồ Đào Nha cũng được viết bằng bảng chữ cái Latinh
  • Chụp ảnh đường phố rồi loại bỏ một số địa danh, kết quả sai số khoảng 500 km nhưng vẫn suy luận đúng được nhiều điều
    • Khi dùng toàn bộ ảnh, nó nhận nhầm một hòn đảo nổi tiếng
    • Ngay cả khi dùng ảnh địa danh từ Google Images, nó cũng nhận đó là cùng một hòn đảo
  • Tin chắc đây là kỹ thuật vượt xa ChatGPT
    • Khi đưa ảnh tạo bằng ChatGPT vào tính năng "Describe" của Midjourney, nó tạo ra mô tả bao gồm cả vị trí chính xác
    • Cách sắp xếp các ngọn núi ở hậu cảnh dường như cho thấy một khu vực cụ thể
  • Mỗi khi xuất hiện một xu hướng mới lại thấy phản cảm
    • Khi cho xem ảnh đường phố ở Rome, ảnh đã bị xóa vì vi phạm chính sách
  • Khi hỏi cách chỉnh đồng hồ trên radio ô tô, nó xác định đúng cách làm và cả mẫu radio
  • Lo ngại về "rủi ro quyền riêng tư mới"
    • Bản thân internet đã hàm chứa rủi ro quyền riêng tư
    • Việc liên tục nhấn mạnh mọi rủi ro mới là thái quá
  • Kỹ thuật suy luận vị trí trong game Geoguessr sẽ tiếp tục phát triển
    • Sẽ có công nghệ xác định chính xác vị trí thông qua ảnh vệ tinh hoặc ảnh không phải vệ tinh
  • Trong game Geoguessr, dùng Gemini 2.5 đạt 22k/25k điểm
    • Chính xác ở Essen của Đức và Sheffield của Anh, nhưng bị lệch ở Ý và Nga
    • Đây là kết quả suy luận chỉ từ một ảnh duy nhất
  • Phân tích ảnh chụp trên sông Hàn ở thành phố Đà Nẵng, Việt Nam và xác định chính xác vị trí
    • Xác nhận rằng kỹ thuật phân tích này tồn tại
  • Xác định đúng thành phố qua ảnh đường phố, nhưng suy luận sai về con phố hoặc khu phố cụ thể
    • Tìm kiếm hình ảnh ngược của Google cho kết quả chính xác hơn