3 điểm bởi GN⁺ 2 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Theo blog của Terence Eden, trong 28 ngày gần đây, người đăng ký RSS và bản tin email đã mang lại nhiều lưu lượng truy cập hơn các công cụ tìm kiếm lớn như Google
  • Blog này có những yếu tố như bố cục ngữ nghĩasiêu dữ liệu đánh giá, nhưng không dùng SEO quá đà như nhồi nhét từ khóa hay AMP
  • Tác giả dùng thu thập thống kê nhẹ, chỉ chạy cục bộ để xác định nguồn truy cập; trong các công cụ tìm kiếm thì Google đứng nhóm đầu, DuckDuckGo cũng cao, còn Bing khó lọt vào top 20 trong bất kỳ ngày nào
  • Theo dõi RSS và email ghi nhận hit bằng ảnh tải chậm ở cuối bài hoặc ảnh theo dõi được tải, nhưng cần xem đây là dữ liệu thất thoát lớn do Gmail làm rối ảnh và nhiều crawler/bot bị chặn
  • Người vào từ tìm kiếm ngẫu nhiên và người chủ động chọn đăng ký là hai kiểu lưu lượng khác nhau, và khoảng 25% tổng lưu lượng đến từ những người đã chọn đăng ký

Blog cá nhân nơi RSS mang lại nhiều lượt truy cập hơn Google

  • Theo bài viết của Susam, phần lớn lưu lượng của website cá nhân vẫn đến từ web feed, và Terence Eden cũng kiểm tra xem blog của mình có hiện tượng tương tự hay không
  • Blog này đã hoạt động lâu năm, nhưng không quá chú trọng vào SEO quá đà

Cách đo nguồn truy cập và những giới hạn

  • Năm ngoái, tác giả đã thêm một hệ thống thu thập thống kê nhẹ, chỉ chạy cục bộ vào blog, nhờ đó có thể xem người dùng đến từ những trang nào
  • Trong lưu lượng từ công cụ tìm kiếm, Google nằm trong nhóm đầu, DuckDuckGo cũng cao bất ngờ, còn Bing thì khó lọt top 20 trong bất kỳ ngày nào
  • Cũng có thể thấy lưu lượng từ Fediverse và BlueSky, còn lưu lượng từ Twitter gần như đã biến mất
  • Từ vài tuần trước, tác giả cũng thêm theo dõi RSS và bản tin email
    • Khi người đăng ký RSS mở bài viết và ứng dụng khách tải ảnh tải chậm ở cuối bài, một hit sẽ được ghi nhận
    • Với email cũng gần tương tự: khi thư được mở và ảnh theo dõi được tải, một hit sẽ được ghi nhận
    • Gmail làm rối hình ảnh ở một mức độ nào đó, nên việc đo email cũng không chính xác
  • Đây là dữ liệu có mức thất thoát rất lớn và không nhằm đạt tới các con số siêu chính xác
    • Tác giả đang chặn càng nhiều crawler AI và bot càng tốt
    • Mục đích không phải theo dõi người dùng khắp web hay bán thứ gì đó, mà chỉ muốn biết đại khái mọi người phát hiện ra blog từ đâu

Những gì lộ ra từ lưu lượng 28 ngày gần đây

  • Trong dữ liệu lượt xem blog của 28 ngày gần đây, những người đã chọn đăng ký mang lại nhiều lưu lượng hơn các công cụ tìm kiếm lớn
  • Có những tháng lưu lượng tăng vọt từ các trang tổng hợp liên kết như HN hay Reddit
  • Đôi khi blog cũng được dẫn link từ các trang nổi tiếng hoặc được trích dẫn trong các công trình học thuật
  • Bình thường, lưu lượng đến rải rác một ít từ nhiều nơi khác nhau
  • Dù vậy, điều gây ngạc nhiên là có nhiều người chọn đăng ký miễn phí, và họ tạo ra nhiều lưu lượng hơn các công cụ tìm kiếm lớn

Ý nghĩa và lưu ý về lưu lượng từ RSS

  • Người tìm một thứ gì đó qua công cụ tìm kiếm rồi tình cờ vào blog và người tự mình thích rồi chọn đăng ký là hai loại lưu lượng rất khác nhau
  • Dù vậy, khoảng 25% tổng lưu lượng đến từ những người đã chọn đăng ký
  • Vì lý do lịch sử, tác giả đang vận hành riêng cả feed Atom lẫn RSS; có thể cân nhắc gộp chúng lại, nhưng việc phát hành ở hai định dạng hơi khác nhau này cũng không tốn nhiều công sức

1 bình luận

 
Ý kiến trên Lobste.rs
  • Hỏi vì tò mò thôi, thực sự có bao nhiêu người dùng trình đọc RSS nhỉ?
    Tôi thì không dùng, nhưng đọc cái này lại có cảm giác rằng ngay cả trong giới kỹ thuật, có lẽ phe không dùng mới là thiểu số
    Có nên dùng trình đọc RSS thay vì giao việc trì hoãn cho các trang tổng hợp liên kết không?
    • Có rất nhiều blog thú vị mà khoảng cách giữa các bài là vài tháng, vài năm, và phần lớn những bài đó chẳng bao giờ lên trang nhất của bất kỳ trang tổng hợp liên kết nào, nên tôi dùng RSS
      Ngay cả khi Twitter vẫn còn tạm dùng được, nó cũng rất tệ trong việc bắt được những bài như vậy, và chúng trôi vụt qua feed rất nhanh
    • Tôi có dùng RSS, và đã thật sự rất cố gắng để khiến dù chỉ một người bạn của mình cũng dùng, nhưng thất bại
      Dù vậy, tôi vẫn xem RSS là một công nghệ ngách khá rõ trong toàn bộ giới làm kỹ thuật, chỉ là trong số những người đăng bài lên lobste.rs thì có vẻ nó được dùng nhiều hơn vì rất hợp để theo dõi nhiều blog
    • Tôi dùng hằng ngày từ thời Google Reader, và giờ dùng Feedly
      Tôi thấy nó là một nguồn cung tuyệt vời cho việc trì hoãn
    • Tôi đã thử nhiều trình đọc khác nhau, nhưng cuối cùng thứ khiến tôi gắn bó là https://vore.website cực kỳ đơn giản do ~j3s làm ra
    • Tôi bắt đầu dùng RSS với Thunderbird cách đây không lâu
      Trớ trêu thay, chính vì hầu hết các trang tổng hợp liên kết và mạng xã hội về công nghệ mà tôi theo dõi đều đã biến thành bãi rác hoặc bị ép thành như vậy nên tôi mới bắt đầu
      Tôi đã lục lại bookmark và lịch sử truy cập cũ để gom vài chục blog ngách theo tên miền riêng, và còn rất nhiều cách để tìm thêm: tìm bằng marginalia, mục discover của bearblog, tìm các instance gitea/forgejo cá nhân để kiểm tra các subdomain blog, vô tình bắt gặp khi tìm đại gì đó, hoặc tìm được danh sách các site ai đó gom trong một kho GitHub, v.v.
      Có blog sẽ liên kết sang blog khác, rồi blog đó lại liên kết sang blog khác nữa, cứ thế tiếp diễn, và đó đúng là mỏ vàng
      Giờ chắc tôi có đến vài trăm feed rồi, và đang dần quên mất mình đã tìm ra chúng bằng cách nào
      Ngoài các blog ngách, cũng có khá nhiều vendor và CERT tự vận hành feed riêng, nên cực kỳ tiện để theo dõi tin tức an ninh thông tin
      Bạn có biết rằng nếu thêm seclists.org vào trình đọc feed thì có thể nhận mailing list oss-sec dưới dạng RSS feed không?
      Thỉnh thoảng trong các thông báo bảo mật, người ta ghi công cho một tổ chức hay cá nhân cụ thể vì đã báo cáo; nếu may mắn, họ có một blog chất lượng cao, và may hơn nữa là có cả feed
      Chỉ cần thêm vào trình đọc rồi tiếp tục đi tiếp
      Dù sao thì những site này đặc biệt hay ở chỗ giúp bạn thoát ra đôi chút khỏi bong bóng Mỹ/Tây Âu mà các site kia rất dễ nhốt bạn vào
      Không nhất thiết phải bỏ hẳn các trang tổng hợp liên kết; nếu muốn tăng năng suất thì có thể bỏ, nhưng chúng bổ trợ cho trình đọc feed hơn là thay thế nhau
  • Tôi xem log của mình vì tò mò và thấy khá thú vị
    Vì tôi cố tránh Google và các công cụ tìm kiếm càng nhiều càng tốt nên cũng không kỳ vọng nhiều traffic từ đó
    Nhìn vào log của riêng ngày 4 tháng 5, bỏ qua các crawler khác nhau mà tôi đẩy vào mê cung rác, thì như sau:
    • Có 32 referrer chứa google.com, và cả 32 đều yêu cầu /atom.xml
    • Tổng số request là 5231
    • Trong đó 3329 là request RSS feed
    • 1902 là các request khác
      Việc Google về cơ bản không gửi traffic nào không làm tôi ngạc nhiên
      Tôi đã cấu hình là đừng lập chỉ mục, nên đó là kết quả tôi mong muốn
      Nhưng ít nhất với site cụ thể này, tức blog của tôi, trong ngày hôm đó traffic RSS lớn hơn đáng kể so với lượt truy cập trực tiếp
      Nếu nhìn khoảng 7 ngày log tổng cộng thì có 1,9 vạn request thường và 2,7 vạn RSS/Atom, nên feed vẫn thắng!