9 điểm bởi davespark 2026-01-06 | 1 bình luận | Chia sẻ qua WhatsApp

Bài viết đề cập đến thế tiến thoái lưỡng nan về cách trình duyệt dựa trên AI nên diễn giải văn bản người dùng nhập vào thanh địa chỉ.

Ví dụ, khi người dùng nhập "Who Framed Roger Rabbit" (tên một bộ phim), trình duyệt truyền thống sẽ coi đây là từ khóa tìm kiếm và hiển thị các kết quả liên quan đến bộ phim, nhưng một số trình duyệt AI lại hiểu nhầm đây là câu hỏi "Ai đã gài bẫy Roger Rabbit?" và đưa ra câu trả lời trực tiếp như trong chat. Điều này gây bất tiện vì không phải là kết quả tìm kiếm mà người dùng mong muốn.

So sánh cách tiếp cận của các trình duyệt AI chính:

  • Dia (được Atlassian mua lại): sử dụng mô hình phân loại cục bộ (dựa trên DistilBERT, khoảng 160MB) để phát hiện đầu vào “giống câu hỏi”. Ví dụ: "Atlassian đã mua công ty trình duyệt với giá bao nhiêu?" → trả lời trực tiếp "610 triệu USD". Tuy vậy, cũng có nhiều lỗi.
  • ChatGPT Atlas: áp dụng quy tắc đơn giản – dưới 10 từ thì tìm kiếm, vượt quá thì chat. Có thể dùng phím tắt (⌘+Return) để ép chuyển sang chế độ chat.
  • Perplexity Comet & Google Chrome: gửi mọi truy vấn tới công cụ tìm kiếm để mô hình lớn phía máy chủ quyết định giữa kết quả tìm kiếm và câu trả lời AI.

Điều thú vị là trình duyệt diễn giải "who framed roger rabbit" như một câu hỏi chỉ có Dia. Các trình duyệt còn lại đều xử lý nó như tìm kiếm.

Vấn đề này không chỉ áp dụng cho trình duyệt mà còn là thách thức chung của mọi ô nhập kiểu "omnibox" (giao diện phải diễn giải nhanh và chính xác ý định của người dùng). Dù AI có thông minh hơn nữa, độ chính xác trong việc hiểu đầu vào vẫn sẽ tiếp tục là một bài toán quan trọng.

1 bình luận

 
aer0700 2026-01-08

Để chính xác 100% thì có lẽ đó thuộc về lĩnh vực đọc ý nghĩ, muốn chính xác 99% thì có lẽ là lĩnh vực của thống kê. Đây là một bài toán lớn.