1 điểm bởi GN⁺ 5 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Sự sa sút về chất lượng của công cụ tìm kiếm trở thành dịp để tận dụng lại siêu liên kết và các trang liên kết cá nhân, một cách khám phá web cũ nhưng hiệu quả
  • Google đã khó dùng suốt nhiều năm, DuckDuckGo/Bing thì liên tục tệ đi, còn Yandex tương đối ấn tượng nhưng vẫn chưa đạt mức tối tân thực sự
  • YouTube thực sự tệ nhất, với những khuôn mặt na ná nhau và các nền tiêu đề được trau chuốt lặp đi lặp lại, khiến người ta muốn né cả việc tìm kiếm
  • Kagi có vẻ phụ thuộc vào các công cụ tìm kiếm ở trên, còn phần tóm tắt tìm kiếm bằng LLM có giới hạn là chỉ là bản tóm tắt không xác định được dựng trên các kết quả tìm kiếm chất lượng thấp
  • Khi các trang cá nhân trực tiếp đặt liên kết tới những website mình yêu thích, đó trở thành cách giành lại World Wide Web khỏi web tập trung, từng siêu liên kết một

Vấn đề cốt lõi

  • Bài viết bắt đầu từ nhận thức rằng sự suy giảm hiệu năng của công cụ tìm kiếm giờ đây đã khó có thể phủ nhận
  • Google đã không còn dùng ổn trong nhiều năm, DuckDuckGo/Bing thì đều đặn đi xuống, còn Yandex nếu so ra có phần ấn tượng hơn nhưng vẫn chậm vài bước so với trình độ tối tân trước đây
  • Tìm kiếm trên YouTube trở thành thứ người ta instinctively muốn tránh vì các video cứ lặp lại cùng kiểu khuôn mặt và thẻ tiêu đề giống nhau
  • Kagi thường được khuyên dùng, nhưng có vẻ phụ thuộc vào 3 nhà cung cấp đã nhắc ở trên
  • LLM có thể tìm thay, nhưng khi chính kết quả tìm kiếm đã kém chất lượng thì bản tóm tắt không xác định được tạo ra trên đó cũng không giải quyết được vấn đề

Cách ứng phó được đề xuất

  • Giải pháp là nghĩ ra ngoài ô tìm kiếm, và câu trả lời là siêu liên kết
  • Trên web thời kỳ đầu, người ta thường bấm vào các trang “links” quen thuộc của những website thú vị để khám phá thêm các site khác
  • Những liên kết đó đôi khi không liên quan hoặc đã chết, nhưng đôi khi lại chính xác đến mức dẫn tới những website đáng nhớ rất lâu
  • Thay vì than thở về web tập trung, chủ website có thể trực tiếp liên kết tới những website mà mình yêu thích
  • links page mới của tôi không phải “web ring”, cũng không phải theo dõi chéo, mà chỉ đơn giản là danh sách những thứ tôi thích
  • Tôi không kỳ vọng các site được liên kết sẽ liên kết lại, và ngay cả khi ai đó liên kết tới mình thì cũng không nên mong chờ liên kết đáp lại
  • Nếu mỗi người liên kết tới nơi mình muốn và tự tạo trang liên kết riêng, đó sẽ là cách giành lại World Wide Web, từng siêu liên kết một

1 bình luận

 
Ý kiến trên Lobste.rs
  • Đáng tiếc là tôi đã thấy Google thực sự đặt khá nhiều liên kết tốt trong bảng tổng quan AI, và những liên kết đó thường tốt hơn các kết quả tìm kiếm đứng đầu thông thường Ví dụ, khi tìm "what is a linked list", ở đầu thanh bên của vùng AI là một thread Reddit, tiếp theo là bài Wikipedia tương ứng. Cá nhân tôi nghĩ Wikipedia đáng ra phải đứng số 1, nhưng dù sao thì kết quả là vậy Trong khi đó, kết quả tìm kiếm thông thường số 1 là một bài của GeeksForGeeks; không phải tôi muốn chỉ trích GeeksForGeeks, nhưng đó là kiểu bài được tối ưu hóa cho công cụ tìm kiếm rất mạnh, và dù trên web có nội dung tốt hơn thì nó vẫn được xếp hạng cao. Trong trường hợp này, Wikipedia đứng thứ 2 Ngay cả nếu LLM chọn liên kết tốt hơn, tôi cũng không nghĩ thực sự là vậy mà nhiều khả năng là kết quả được thiết kế cẩn thận, và đây là một ví dụ điển hình của enshittification. Họ giấu các liên kết tốt trong , và nếu bấm vào đó thì trên chỉ số bạn sẽ trở thành một người tiêu dùng mớ tạp nham hạnh phúc. Bởi vì họ đã biết rõ rằng kết quả tìm kiếm thực sự vốn đã tệ

    • Tôi có nói “không phải tôi muốn chỉ trích GeeksForGeeks”, nhưng thật ra trang đó hoàn toàn xứng đáng bị phê bình. Họ rất giỏi tối ưu hóa công cụ tìm kiếm, nhưng hiếm khi có đúng thông tin bạn đang tìm, và đó đã là loại nội dung “slop” từ trước cả khi từ này trở nên phổ biến. Vì vậy đây là một trong những trang tôi đã chặn khỏi kết quả tìm kiếm
    • Thay vì dùng công cụ tìm kiếm đa dụng, một điều khá khai sáng với tôi là dùng tìm kiếm chuyên biệt khi rõ ràng đã có một lựa chọn phù hợp hơn. Nếu đang tìm về linked list thì khả năng cao thứ bạn muốn nằm trên Wikipedia, nên chẳng có lý do gì phải dùng Google Tôi đã thêm shortcut vào Firefox để chỉ cần gõ @w linked list là đi thẳng tới Wikipedia. Cũng có rất nhiều dạng tìm kiếm hẹp và chuyên biệt hơn như Arch Wiki, MDN, Stack Overflow, IMDB Ngay từ đầu, chính ý tưởng rằng một công ty có thể vận hành một dịch vụ dùng để tìm bất kỳ thông tin nào trên toàn thế giới cũng đã khá đáng ngờ. Tôi đã viết về điều này vào năm ngoái Rất dễ hoài niệm rằng “ngày xưa chỉ cần nhập vài từ khóa vào Google là có thể tìm thấy bất cứ thứ gì tồn tại”, nhưng thật ra điều đó chưa bao giờ đúng. Đổi lại việc không phải lần mò trong một web hỗn loạn, chúng ta đã cho phép Google thay đổi chính định nghĩa của web. Ta từng nói “nếu không có trên Google thì nó không tồn tại”, nhưng điều đó sai, và giờ ta mới bắt đầu thấy nó sai đến mức nào Về bản chất, không thể có chuyện nhìn toàn bộ web một cách khách quan từ góc nhìn của thần thánh. Để lập chỉ mục một thứ khổng lồ như web mà vẫn ngăn được việc lạm dụng, bạn phải đưa ra hàng nghìn phán đoán lớn nhỏ. Mỗi lần tìm kiếm, hay đúng hơn là mỗi lần trừu tượng hóa, ta đều chấp nhận một sự đơn giản hóa của thực tại. Bản đồ không phải lãnh thổ; chỉ mục cũng không phải web https://search.technomancy.us/why
    • &udm=14, tự nhận là “mã Konami để bỏ enshittification”. Nó luôn chuyển hướng bạn sang tab tìm kiếm Web, vốn thường bị giấu dưới “More”. Tôi đã bật nó trên nhiều thiết bị một thời gian và rất hài lòng vì lấy lại được kiểu tìm kiếm “ngu ngốc” Dù vẫn còn các vấn đề của tối ưu hóa công cụ tìm kiếm và thao túng thứ hạng, nó phần nào trả lại cảm giác kiểm soát mà AI Overview đã lấy mất
    • Hiện tượng này đã diễn ra một thời gian, và năm ngoái tôi cũng đã viết một ví dụ lên blog. Nó cực kỳ khó chịu, và chỉ có thể là một thiết kế có chủ đích nhằm giữ người dùng ở lại lâu hơn trên trang của Google Tôi xem thỏa thuận giữa Google và các website gần như đã vô hiệu. Nếu họ còn chưa sẵn sàng hiển thị liên kết tới site của tôi, thì tại sao tôi phải cho phép bot của họ crawl site của tôi?
  • Như đã nhắc trên blog, nếu vẫn chưa thử thì rất nên dùng thử Kagi một lần. Ai cũng biết Kagi dùng dữ liệu crawl hoặc chỉ mục tìm kiếm của các công cụ tìm kiếm lớn khác, nhưng họ chỉ dùng dữ liệu thôi, còn thứ hạng kết quả tìm kiếm thì tự xếp Tôi đã dùng hơn 2 năm và khá hài lòng; cũng có lúc tìm được thứ mà DuckDuckGo không tìm ra. Bạn có thể đẩy một trang lên, hạ một trang xuống hoặc chặn hẳn khỏi kết quả tìm kiếm, và còn có nhiều tính năng như Redirects (URL Rewrites) Tôi cũng thích cách Kagi giao tiếp công khai. Trong Changelog có đính kèm liên kết tới từng ticket trên Kagi Feedback, nơi này cũng đóng vai trò như một issue tracker. Họ còn có cả trang Status. Về ý tưởng tạo một trang liên kết ngay trên site của mình, Kagi Small Web cũng khá giống ở mức nào đó, và trên Kagi Small Web website bạn có thể ghé thăm các website ngẫu nhiên John Gruber (Daring Fireball) và Cory Doctorow (Pluralistic) cũng đang dùng. Ví dụ có thể tham khảo Seriously, Give Kagi a Try, Another Periodic Suggestion to Try, Just Try, Switching to Kagi for Search, Tim Bray: ‘Mourning Google’, The Talk Show: ‘A Professional Internet User’, With Kagi Founder and CEO Vlad Prelovac, Tag: kagi Có bản dùng thử 100 lượt tìm kiếm, và tùy lượng tìm kiếm mà gói Starter giá $54/năm có thể là đủ. Nếu cần nhiều hơn thì xem tại Individual Pricing. Cũng có Duo and Family nên chi phí mỗi người có thể thấp hơn, nhưng chỉ áp dụng từ gói Professional trở lên. Có thể nâng hoặc hạ gói bất cứ lúc nào, và số dư còn lại sẽ được tính theo tỷ lệ để áp vào gói mới

    • Nhưng Kagi dùng Yandex, nên trả tiền cho họ cũng đồng nghĩa với việc gián tiếp hỗ trợ chế độ Putin. Tôi không muốn biết rõ điều đó mà vẫn hỗ trợ một việc đang giết hại người Ukraine
    • Thực ra họ đang tổng hợp từ nhiều nguồn. Dù vậy tôi vẫn đồng ý là nó rất xuất sắc, và tôi vừa gia hạn đăng ký xong
    • Tôi nhớ là DuckDuckGo cũng cho phép chặn site khỏi kết quả tìm kiếm. Có vẻ không có chức năng đẩy site lên hay hạ site xuống, hoặc ít nhất là tôi chưa từng thử Cũng cần biết rằng trước khi chuyển sang tìm kiếm, Kagi khởi đầu là một công ty AI [https://help.kagi.com/kagi/ai/kagi-ai.html]. Bản thân chuyện này không nhằm ám chỉ điều gì, nhưng có lẽ nhiều người chưa biết nên tôi chia sẻ Nói trực diện hơn thì, toàn bộ bài viết được viết giống quảng cáo quá, nên tốt hơn là tiếp nhận lời khuyên một cách thận trọng
    • Tôi đã nghe rất nhiều lời khen về Kagi, nhưng với tôi thì không may được như vậy. Không phải tôi phủ nhận trải nghiệm đó; tôi nghĩ có khả năng là mình đang dùng sai. Vì thế tôi tò mò mọi người đang nhập những kiểu truy vấn nào vào Kagi Truy vấn chuẩn mà tôi dùng là "sesans spin echo length formula". Trên DuckDuckGo, liên kết đầu tiên là trang SESANS Wiki nhưng không có công thức tôi cần, còn liên kết thứ hai là bài báo có chứa công thức đó. Trên Google, liên kết đầu tiên là tài liệu hội nghị có khá nhiều nền tảng toán học của SESANS nhưng vẫn không có công thức mong muốn, và bài báo có công thức lại xuất hiện ở liên kết thứ hai. Phần giải thích các hằng số ở đó cũng tốt hơn liên kết thứ hai của DDG Trên Kagi thì phải đến liên kết thứ sáu tôi mới thấy quan hệ mà mình đang tìm. Theo tiêu chí của tôi thì Kagi tệ hơn, nhưng cũng có thể bản thân tiêu chí đó không tốt. Tôi muốn biết Kagi hoạt động tốt nhất với những kiểu tìm kiếm nào
    • Tôi từng thích Kagi, nhưng rồi ngừng dùng sau khi biết họ đang chuyển tiền sang Nga Gần đây tôi bắt đầu dùng Uruky và thấy khá ổn. Không hoàn hảo, nhưng vẫn tốt hơn Google hiện tại. Tuy vậy tôi chưa đào sâu nguồn dữ liệu của họ, chỉ xác nhận là không phải Yandex, nên nếu ai biết thêm thì tôi rất muốn nghe
  • Năm 2024, Google và Reddit đã ký một hợp đồng 60 triệu USD để dùng nội dung Reddit cho việc huấn luyện AI của Google. Vì thế mà tìm kiếm Google dạo này gần giống như thêm tiền tố site:Reddit vào truy vấn Những website cũ tốt ngày xưa thì bị giấu phía sau các kết quả kém chất lượng và ít liên quan

  • Dạo này tôi tự hỏi liệu các thư mục do con người tuyển chọn kiểu như những site Yahoo thuở ban đầu có phải là lời giải không. Theo kiểu gắn thêm một cách để tìm kiếm trong các site đó. Marginalia có vẻ hơi giống, nhưng tôi không thấy phần thư mục

    • Tôi cũng đã nghĩ như vậy. Tác giả về cơ bản đang phát minh lại web directory, và có vẻ đã đến lúc chúng ta lại cần nó, bất chấp vấn đề về khả năng mở rộng
    • Đúng vậy. Chính là cái đó. Làm ơn hãy có ai đó tạo một cái đi
  • Tôi không biết câu “Kagi có vẻ phụ thuộc vào 3 nhà cung cấp được nhắc ở trên” có đúng sự thật không, nhưng theo nghĩa đen thì điều đó chẳng quan trọng mấy. Kagi Search thực sự rất tuyệt, và kể cả giá có tăng gấp đôi thì chắc tôi vẫn sẽ trả. Trung bình tôi tìm 1.432 lần mỗi tháng, và như vậy hoàn toàn xứng đáng

    • Tôi tò mò khi chạy Kagi song song với các công cụ tìm kiếm khác thì bạn đã thấy khác biệt gì. Có truy vấn ví dụ nào không
  • Mọi người nói “sự suy giảm chức năng của công cụ tìm kiếm giờ đã khó phủ nhận”, nhưng chẳng lẽ chỉ mình tôi là không cảm nhận thấy? Tôi vẫn tìm kiếm và tìm được thứ mình cần

  • Tôi đang nghĩ tới cách liên tục lưu cache gần như mọi thứ và lập chỉ mục cho tìm kiếm toàn văn. Vì có vẻ như một số tư liệu biến mất khỏi web hoặc trở nên gần như không thể tìm lại được Trước đây đã có vài dự án tương tự được chia sẻ ở đây. Ý tưởng cơ bản là dùng SQLite và FTS5 cho mọi thứ. Có lẽ cần tìm hiểu thêm về mảng này

    • Tôi đã tạo công cụ tìm kiếm siêu cá nhân hóa của riêng mình bằng SQLite FTS5. Hiện tôi vẫn chưa lập chỉ mục cả lịch sử trình duyệt, mà chỉ lập chỉ mục bookmark và mọi URL tôi đã đăng lên các tài khoản mạng xã hội của mình. Dù vậy, tôi cũng đang thực sự cân nhắc việc lập chỉ mục lịch sử trình duyệt. https://search.technomancy.us Những người khác cũng rất nên thử nghiệm
  • Tôi thấy nó đã được nhắc đến trong hai bình luận, nhưng vẫn đáng để để lại liên kết. Marginalia Search rất tuyệt https://marginalia-search.com/ https://about.marginalia-search.com/

  • Tôi đã viết phản hồi cho một người khác trong chủ đề này, nhưng vì nó có vẻ liên quan đến bài blog nên tôi cũng viết ở cấp cao nhất. Nếu thấy quá giống tự quảng bá hoặc gây khó chịu thì có thể xóa Nói ngắn gọn, nếu lược bớt cảm nghĩ, đã có một thời gian tôi như đang để tang vì nghĩ rằng mình đã mất đi web mà tôi từng biết khi lớn lên. Nhưng hóa ra phần lớn trong số đó vẫn còn ở đâu đó, chỉ là tôi không biết mà thôi. Web hiện đại tất nhiên không giống hệt, và một phần lớn điều tôi đã “để tang” là nỗi hoài niệm hay độ tuổi của chính tôi khi ấy, nhưng dù vậy web vẫn rất rộng lớn và đầy những thứ thú vị, hữu ích và vui vẻ. Chỉ là việc tìm ra chúng đã trở nên thực sự khó khăn, ngay cả từ trước khi các công cụ AI bắt đầu nuốt chửng các công cụ tìm kiếm Tôi đã suy nghĩ rất nhiều về việc mình đã bỏ lỡ trải nghiệm gì, và vì nhiều lý do đã đi đến cùng kết luận với tác giả bài blog. Những liên kết dẫn đến thứ hay ho cần được người thật chia sẻ, và chúng ta cần nuôi dưỡng một cách lướt web chậm rãi hơn, có chủ đích hơn. Với tinh thần đó, tôi đã tạo ra một công cụ để xây dựng thư mục web cộng tác: https://linklists.net Nó còn rất nhỏ và có nhiều phần thô ráp. Vì nó vừa là công cụ vừa gần giống một dự án nghệ thuật, nên tôi hầu như không quảng bá, chủ yếu chỉ lan truyền chút ít trong cộng đồng web indie. Nó đã chạy ở giai đoạn alpha được vài tháng, và tôi đã thấy có những phần cần thay đổi lớn, nhưng nếu ai tò mò muốn thử thì có thể xem qua