Sự suy tàn của công cụ tìm kiếm là một cơ hội
(lewiscampbell.tech)- Sự sa sút về chất lượng của công cụ tìm kiếm trở thành dịp để tận dụng lại siêu liên kết và các trang liên kết cá nhân, một cách khám phá web cũ nhưng hiệu quả
- Google đã khó dùng suốt nhiều năm, DuckDuckGo/Bing thì liên tục tệ đi, còn Yandex tương đối ấn tượng nhưng vẫn chưa đạt mức tối tân thực sự
- YouTube thực sự tệ nhất, với những khuôn mặt na ná nhau và các nền tiêu đề được trau chuốt lặp đi lặp lại, khiến người ta muốn né cả việc tìm kiếm
- Kagi có vẻ phụ thuộc vào các công cụ tìm kiếm ở trên, còn phần tóm tắt tìm kiếm bằng LLM có giới hạn là chỉ là bản tóm tắt không xác định được dựng trên các kết quả tìm kiếm chất lượng thấp
- Khi các trang cá nhân trực tiếp đặt liên kết tới những website mình yêu thích, đó trở thành cách giành lại World Wide Web khỏi web tập trung, từng siêu liên kết một
Vấn đề cốt lõi
- Bài viết bắt đầu từ nhận thức rằng sự suy giảm hiệu năng của công cụ tìm kiếm giờ đây đã khó có thể phủ nhận
- Google đã không còn dùng ổn trong nhiều năm, DuckDuckGo/Bing thì đều đặn đi xuống, còn Yandex nếu so ra có phần ấn tượng hơn nhưng vẫn chậm vài bước so với trình độ tối tân trước đây
- Tìm kiếm trên YouTube trở thành thứ người ta instinctively muốn tránh vì các video cứ lặp lại cùng kiểu khuôn mặt và thẻ tiêu đề giống nhau
- Kagi thường được khuyên dùng, nhưng có vẻ phụ thuộc vào 3 nhà cung cấp đã nhắc ở trên
- LLM có thể tìm thay, nhưng khi chính kết quả tìm kiếm đã kém chất lượng thì bản tóm tắt không xác định được tạo ra trên đó cũng không giải quyết được vấn đề
Cách ứng phó được đề xuất
- Giải pháp là nghĩ ra ngoài ô tìm kiếm, và câu trả lời là siêu liên kết
- Trên web thời kỳ đầu, người ta thường bấm vào các trang “links” quen thuộc của những website thú vị để khám phá thêm các site khác
- Những liên kết đó đôi khi không liên quan hoặc đã chết, nhưng đôi khi lại chính xác đến mức dẫn tới những website đáng nhớ rất lâu
- Thay vì than thở về web tập trung, chủ website có thể trực tiếp liên kết tới những website mà mình yêu thích
- links page mới của tôi không phải “web ring”, cũng không phải theo dõi chéo, mà chỉ đơn giản là danh sách những thứ tôi thích
- Tôi không kỳ vọng các site được liên kết sẽ liên kết lại, và ngay cả khi ai đó liên kết tới mình thì cũng không nên mong chờ liên kết đáp lại
- Nếu mỗi người liên kết tới nơi mình muốn và tự tạo trang liên kết riêng, đó sẽ là cách giành lại World Wide Web, từng siêu liên kết một
1 bình luận
Ý kiến trên Lobste.rs
Đáng tiếc là tôi đã thấy Google thực sự đặt khá nhiều liên kết tốt trong bảng tổng quan AI, và những liên kết đó thường tốt hơn các kết quả tìm kiếm đứng đầu thông thường Ví dụ, khi tìm "what is a linked list", ở đầu thanh bên của vùng AI là một thread Reddit, tiếp theo là bài Wikipedia tương ứng. Cá nhân tôi nghĩ Wikipedia đáng ra phải đứng số 1, nhưng dù sao thì kết quả là vậy Trong khi đó, kết quả tìm kiếm thông thường số 1 là một bài của GeeksForGeeks; không phải tôi muốn chỉ trích GeeksForGeeks, nhưng đó là kiểu bài được tối ưu hóa cho công cụ tìm kiếm rất mạnh, và dù trên web có nội dung tốt hơn thì nó vẫn được xếp hạng cao. Trong trường hợp này, Wikipedia đứng thứ 2 Ngay cả nếu LLM chọn liên kết tốt hơn, tôi cũng không nghĩ thực sự là vậy mà nhiều khả năng là kết quả được thiết kế cẩn thận, và đây là một ví dụ điển hình của enshittification. Họ giấu các liên kết tốt trong
, và nếu bấm vào đó thì trên chỉ số bạn sẽ trở thành một người tiêu dùng mớ tạp nham hạnh phúc. Bởi vì họ đã biết rõ rằng kết quả tìm kiếm thực sự vốn đã tệ@w linked listlà đi thẳng tới Wikipedia. Cũng có rất nhiều dạng tìm kiếm hẹp và chuyên biệt hơn như Arch Wiki, MDN, Stack Overflow, IMDB Ngay từ đầu, chính ý tưởng rằng một công ty có thể vận hành một dịch vụ dùng để tìm bất kỳ thông tin nào trên toàn thế giới cũng đã khá đáng ngờ. Tôi đã viết về điều này vào năm ngoái Rất dễ hoài niệm rằng “ngày xưa chỉ cần nhập vài từ khóa vào Google là có thể tìm thấy bất cứ thứ gì tồn tại”, nhưng thật ra điều đó chưa bao giờ đúng. Đổi lại việc không phải lần mò trong một web hỗn loạn, chúng ta đã cho phép Google thay đổi chính định nghĩa của web. Ta từng nói “nếu không có trên Google thì nó không tồn tại”, nhưng điều đó sai, và giờ ta mới bắt đầu thấy nó sai đến mức nào Về bản chất, không thể có chuyện nhìn toàn bộ web một cách khách quan từ góc nhìn của thần thánh. Để lập chỉ mục một thứ khổng lồ như web mà vẫn ngăn được việc lạm dụng, bạn phải đưa ra hàng nghìn phán đoán lớn nhỏ. Mỗi lần tìm kiếm, hay đúng hơn là mỗi lần trừu tượng hóa, ta đều chấp nhận một sự đơn giản hóa của thực tại. Bản đồ không phải lãnh thổ; chỉ mục cũng không phải web https://search.technomancy.us/whyNhư đã nhắc trên blog, nếu vẫn chưa thử thì rất nên dùng thử Kagi một lần. Ai cũng biết Kagi dùng dữ liệu crawl hoặc chỉ mục tìm kiếm của các công cụ tìm kiếm lớn khác, nhưng họ chỉ dùng dữ liệu thôi, còn thứ hạng kết quả tìm kiếm thì tự xếp Tôi đã dùng hơn 2 năm và khá hài lòng; cũng có lúc tìm được thứ mà DuckDuckGo không tìm ra. Bạn có thể đẩy một trang lên, hạ một trang xuống hoặc chặn hẳn khỏi kết quả tìm kiếm, và còn có nhiều tính năng như Redirects (URL Rewrites) Tôi cũng thích cách Kagi giao tiếp công khai. Trong Changelog có đính kèm liên kết tới từng ticket trên Kagi Feedback, nơi này cũng đóng vai trò như một issue tracker. Họ còn có cả trang Status. Về ý tưởng tạo một trang liên kết ngay trên site của mình, Kagi Small Web cũng khá giống ở mức nào đó, và trên Kagi Small Web website bạn có thể ghé thăm các website ngẫu nhiên John Gruber (Daring Fireball) và Cory Doctorow (Pluralistic) cũng đang dùng. Ví dụ có thể tham khảo Seriously, Give Kagi a Try, Another Periodic Suggestion to Try, Just Try, Switching to Kagi for Search, Tim Bray: ‘Mourning Google’, The Talk Show: ‘A Professional Internet User’, With Kagi Founder and CEO Vlad Prelovac, Tag: kagi Có bản dùng thử 100 lượt tìm kiếm, và tùy lượng tìm kiếm mà gói Starter giá $54/năm có thể là đủ. Nếu cần nhiều hơn thì xem tại Individual Pricing. Cũng có Duo and Family nên chi phí mỗi người có thể thấp hơn, nhưng chỉ áp dụng từ gói Professional trở lên. Có thể nâng hoặc hạ gói bất cứ lúc nào, và số dư còn lại sẽ được tính theo tỷ lệ để áp vào gói mới
Năm 2024, Google và Reddit đã ký một hợp đồng 60 triệu USD để dùng nội dung Reddit cho việc huấn luyện AI của Google. Vì thế mà tìm kiếm Google dạo này gần giống như thêm tiền tố
site:Redditvào truy vấn Những website cũ tốt ngày xưa thì bị giấu phía sau các kết quả kém chất lượng và ít liên quanDạo này tôi tự hỏi liệu các thư mục do con người tuyển chọn kiểu như những site Yahoo thuở ban đầu có phải là lời giải không. Theo kiểu gắn thêm một cách để tìm kiếm trong các site đó. Marginalia có vẻ hơi giống, nhưng tôi không thấy phần thư mục
Tôi không biết câu “Kagi có vẻ phụ thuộc vào 3 nhà cung cấp được nhắc ở trên” có đúng sự thật không, nhưng theo nghĩa đen thì điều đó chẳng quan trọng mấy. Kagi Search thực sự rất tuyệt, và kể cả giá có tăng gấp đôi thì chắc tôi vẫn sẽ trả. Trung bình tôi tìm 1.432 lần mỗi tháng, và như vậy hoàn toàn xứng đáng
Mọi người nói “sự suy giảm chức năng của công cụ tìm kiếm giờ đã khó phủ nhận”, nhưng chẳng lẽ chỉ mình tôi là không cảm nhận thấy? Tôi vẫn tìm kiếm và tìm được thứ mình cần
Tôi đang nghĩ tới cách liên tục lưu cache gần như mọi thứ và lập chỉ mục cho tìm kiếm toàn văn. Vì có vẻ như một số tư liệu biến mất khỏi web hoặc trở nên gần như không thể tìm lại được Trước đây đã có vài dự án tương tự được chia sẻ ở đây. Ý tưởng cơ bản là dùng SQLite và FTS5 cho mọi thứ. Có lẽ cần tìm hiểu thêm về mảng này
Tôi thấy nó đã được nhắc đến trong hai bình luận, nhưng vẫn đáng để để lại liên kết. Marginalia Search rất tuyệt https://marginalia-search.com/ https://about.marginalia-search.com/
Tôi đã viết phản hồi cho một người khác trong chủ đề này, nhưng vì nó có vẻ liên quan đến bài blog nên tôi cũng viết ở cấp cao nhất. Nếu thấy quá giống tự quảng bá hoặc gây khó chịu thì có thể xóa Nói ngắn gọn, nếu lược bớt cảm nghĩ, đã có một thời gian tôi như đang để tang vì nghĩ rằng mình đã mất đi web mà tôi từng biết khi lớn lên. Nhưng hóa ra phần lớn trong số đó vẫn còn ở đâu đó, chỉ là tôi không biết mà thôi. Web hiện đại tất nhiên không giống hệt, và một phần lớn điều tôi đã “để tang” là nỗi hoài niệm hay độ tuổi của chính tôi khi ấy, nhưng dù vậy web vẫn rất rộng lớn và đầy những thứ thú vị, hữu ích và vui vẻ. Chỉ là việc tìm ra chúng đã trở nên thực sự khó khăn, ngay cả từ trước khi các công cụ AI bắt đầu nuốt chửng các công cụ tìm kiếm Tôi đã suy nghĩ rất nhiều về việc mình đã bỏ lỡ trải nghiệm gì, và vì nhiều lý do đã đi đến cùng kết luận với tác giả bài blog. Những liên kết dẫn đến thứ hay ho cần được người thật chia sẻ, và chúng ta cần nuôi dưỡng một cách lướt web chậm rãi hơn, có chủ đích hơn. Với tinh thần đó, tôi đã tạo ra một công cụ để xây dựng thư mục web cộng tác: https://linklists.net Nó còn rất nhỏ và có nhiều phần thô ráp. Vì nó vừa là công cụ vừa gần giống một dự án nghệ thuật, nên tôi hầu như không quảng bá, chủ yếu chỉ lan truyền chút ít trong cộng đồng web indie. Nó đã chạy ở giai đoạn alpha được vài tháng, và tôi đã thấy có những phần cần thay đổi lớn, nhưng nếu ai tò mò muốn thử thì có thể xem qua