2 điểm bởi GN⁺ 2024-01-01 | 1 bình luận | Chia sẻ qua WhatsApp

Chất lượng kết quả tìm kiếm tệ đến mức nào?

  • Đề xuất một thí nghiệm về chất lượng kết quả tìm kiếm. Ví dụ, việc tìm các dự án mã nguồn mở như yt-dlp bằng những từ khóa phổ biến như "youtube downloader" trở nên khó khăn vì các content farm.
  • Nhiều chuyên gia kỹ thuật cho rằng kết quả tìm kiếm của Google đã kém đi rõ rệt so với 10 năm trước. Trong khi đó, vẫn có những người cho rằng kết quả tìm kiếm vẫn tốt.

So sánh công cụ tìm kiếm và ChatGPT

  • So sánh kết quả tìm kiếm cho ba loại câu hỏi bằng nhiều công cụ tìm kiếm khác nhau và ChatGPT.
  • Các công cụ tìm kiếm được thử nghiệm với trình chặn quảng cáo đã tắt để tái hiện trải nghiệm của người dùng phổ thông.
  • Chất lượng kết quả tìm kiếm được đánh giá một cách chủ quan, và được chấm khác nhau tùy theo sự hiện diện của các kết quả mang tính lừa đảo.

Đánh giá kết quả tìm kiếm

  • Marginalia đôi khi cung cấp câu trả lời tương đối ổn và có tỷ lệ kết quả lừa đảo thấp nhất.
  • Mwmbl cho phép người dùng trực tiếp chỉnh sửa thứ hạng kết quả tìm kiếm.
  • Google có xu hướng trả về các video YouTube gần đây, nhưng điều này hầu như vô dụng với đa số người dùng.
  • ChatGPT cho thấy hiệu năng ấn tượng trong một trường hợp, ở những trường hợp khác thì thực hiện tác vụ phù hợp hoặc từ chối trả lời câu hỏi.

Vấn đề của Google và Bing

  • Google và Bing trả về nhiều loại kết quả sai lệch khác nhau.
  • Hệ sinh thái tìm kiếm truyền thống ưu tiên những gì có lợi nhất cho chuỗi cung ứng phần mềm hơn là cung cấp các kết quả có lợi nhất cho người dùng.

Vấn đề của tìm kiếm dựa trên quảng cáo

  • Các công cụ tìm kiếm dựa trên quảng cáo có động cơ không đồng nhất với việc cung cấp kết quả tìm kiếm tốt cho người dùng.
  • Google khiến việc phân biệt giữa quảng cáo và kết quả tìm kiếm thực tế trở nên khó khăn, dễ gây nhầm lẫn cho người dùng.

Khả năng của các công cụ tìm kiếm nhỏ

  • Bài viết đặt ra câu hỏi liệu các công cụ tìm kiếm nhỏ như Marginalia có thể thay thế Google hay không, hoặc liệu nhiều công cụ tìm kiếm nhỏ có thể cung cấp kết quả tốt hơn Google hay không.
  • Cũng có nghi vấn về việc cách tiếp cận tuyển chọn do người dùng của Mwmbl có thực sự hiệu quả hay không.

Ý kiến của GN⁺

  • Tranh luận về chất lượng kết quả tìm kiếm cho thấy người dùng đang phụ thuộc vào công cụ tìm kiếm nhiều đến mức nào. Các công cụ lớn như Google vẫn chiếm ưu thế, nhưng điều này cũng gợi ý rằng các công cụ tìm kiếm nhỏ có thể cạnh tranh trong những thị trường ngách.
  • Các vấn đề của công cụ tìm kiếm dựa trên quảng cáo nhấn mạnh rằng chúng có thể trở thành rào cản khiến người dùng khó tìm được thông tin mình thật sự muốn. Điều này làm nổi bật nhu cầu về các công cụ tìm kiếm thay thế để cải thiện trải nghiệm người dùng.
  • Bài viết này giúp hiểu cách những người dùng am hiểu công nghệ đang vượt qua các giới hạn của công cụ tìm kiếm, đồng thời cho thấy các vấn đề mà người dùng phổ thông đang phải đối mặt khi tìm kiếm thông tin.

1 bình luận

 
GN⁺ 2024-01-01
Ý kiến trên Hacker News
  • Dù thuật toán của Marginalia Search đã được cải thiện, có thể nó chỉ may mắn với các truy vấn mẫu. Tôi vẫn nghĩ nó khá hên xui so với các lựa chọn thay thế khác. Điều này cho thấy việc đánh giá chất lượng tìm kiếm khó đến mức nào. Cần hiểu rằng với vai trò là công cụ tìm kiếm từ khóa, nó không có khả năng hiểu ngữ nghĩa.
  • Chia sẻ trải nghiệm với Kagi: nghe nói về nó trên HN, rồi sau 100 lượt tìm kiếm thì đăng ký thuê bao. Khi tìm ngẫu nhiên về JS và CSS, MDN hiện lên ở kết quả đầu tiên; nếu không, có thể hạ hạng các trang spam.
  • Tôi là một trong những người vẫn cho rằng kết quả tìm kiếm của Google còn rất tốt. Tôi thừa nhận có dùng trình chặn quảng cáo uBlock Origin, và không có ý định tắt nó. Tôi hiểu quan điểm của tác giả khi tắt trình chặn quảng cáo để mô phỏng trải nghiệm tìm kiếm của người không chuyên, nhưng vẫn có thể làm các bài kiểm tra khác trong khi bật chặn quảng cáo. Kỳ vọng về kết quả tìm kiếm cho yt-dlp không phù hợp với trải nghiệm của người không chuyên.
  • Cung cấp liên kết cho nhiều từ khóa tìm kiếm để so sánh kết quả hiện tại của Kagi với những người không có tài khoản.
  • Đồng ý với tác giả rằng web có quá nhiều spam. Kagi làm khá tốt việc hạ hạng spam, và với các chế độ tìm kiếm đặc biệt như "Small Web", gần như có thể loại bỏ spam.
  • Tôi nghĩ tìm kiếm là một bài toán khó, và ai cũng biết cách thao túng kết quả tìm kiếm. Khuyên dùng những công cụ tìm kiếm cho phép thay đổi danh sách trang một cách hiệu quả, như Kagi hoặc công cụ tìm kiếm lập trình được của Google. Tính năng bỏ phiếu cho kết quả nghe hấp dẫn nhưng có thể bị thao túng. Cách tiếp cận whitelist có nhược điểm, nhưng tôi thích xác minh các tên miền mới qua mạng xã hội hơn.
  • Những tuyên bố rằng chất lượng tìm kiếm đã đi xuống thường dựa trên bằng chứng giai thoại, trong khi đây lẽ ra phải là những tuyên bố có thể kiểm chứng. Đã có nỗ lực đưa ra bằng chứng và tiêu chí thực tế, nhưng cỡ mẫu vẫn quá nhỏ để đưa ra kết luận chung.
  • Không hiểu vì sao những người viết bài về ChatGPT lại dùng phiên bản 3.5. Kết quả khác biệt rõ rệt khi so với GPT-4.
  • Đề xuất thử uBlacklist. Đây là công cụ cho phép chặn kết quả tìm kiếm, có thể đồng bộ cài đặt và danh sách chặn cá nhân với Dropbox hoặc Google Drive. Nó cũng hỗ trợ đăng ký danh sách chặn, nhưng hiện chưa có feed tích hợp sẵn.
  • Đặt câu hỏi về kỳ vọng rằng kết quả tốt cho truy vấn "tải video YouTube" phải là yt-dlp hoặc yt-dlp có giao diện đồ họa. Phần lớn mọi người không quan tâm đến lập trình, và điều đó cho thấy kết quả tìm kiếm mang tính chủ quan.
  • Không thể tái hiện việc tác giả nhận kết quả tệ trên Kagi. Với chính những từ khóa đó, kết quả hiển thị tốt hơn nhiều. Thật khó hiểu tác giả đã nhận được những kết quả tệ như vậy bằng cách nào.
  • Kỳ vọng của tác giả rằng tất cả kết quả tìm kiếm phải trả về cùng một kiểu liên kết là điều khá lạ. Một tìm kiếm mà cả 10 liên kết đều trỏ đến cùng một thứ là tìm kiếm tệ. Kết quả tìm kiếm nên bao phủ các suy đoán hợp lý cho truy vấn đã cho. Quan điểm này cũng được phản ánh trong các chỉ số đánh giá chất lượng công cụ tìm kiếm.