4 điểm bởi GN⁺ 2023-11-03 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bear Blog đăng bài viết về cách làm phân tích bằng CSS, tập trung vào tốc độ, hiệu quả và độ ổn định
  • Bear Blog tránh dùng JavaScript phía client do điểm yếu trước trình chặn quảng cáo và việc không thể phân biệt lưu lượng bot với con người
  • Tác giả giải thích các giới hạn của phân tích dựa trên log máy chủ: coi mọi lưu lượng là như nhau và không thể nhận diện chính xác lưu lượng bot
  • Giải pháp của tác giả là kích hoạt lượt đọc bằng CSS với đoạn mã sau: body:hover { border-image: url("/hit/{{ post.id }}/?ref={{ request.META.HTTP_REFERER }}");}.
  • Cách này được kích hoạt khi người dùng di chuyển con trỏ trên trang hoặc cuộn trên thiết bị di động; tác giả tin rằng đây là chỉ dấu đáng tin cậy của lưu lượng từ con người
  • Hệ thống kiểm tra user-agent để xác nhận không phải bot, trích xuất thông tin trình duyệt và nền tảng, rồi băm địa chỉ IP và ngày để tạo một "lượt đọc" duy nhất cho trang
  • Hệ thống không lưu cookie trình duyệt hay thông tin định danh của độc giả trên máy chủ
  • Tác giả thừa nhận giới hạn của phương pháp này: nhiều lượt đọc từ các thiết bị khác nhau nhưng cùng một địa chỉ IP sẽ bị tính là một lượt đọc
  • Dù vậy, tác giả tin rằng phương pháp này cho số lượt đọc chính xác và đơn giản hơn nhiều hình thức thu thập phân tích khác

1 bình luận

 
GN⁺ 2023-11-03
Ý kiến trên Hacker News
  • Tác giả bài viết đã làm rõ rằng họ dùng hash địa chỉ IP để ngăn lượt xem trùng lặp trong một ngày, nhờ đó mỗi lượt xem trang về cơ bản là duy nhất. Vào cuối mỗi ngày, một worker job sẽ xóa các mục này trong khi vẫn giữ lại thông tin lượt xem.
  • Một người bình luận cho rằng ý tưởng dùng CSS làm trình kích hoạt cho phân tích là rất hay, và chia sẻ một ví dụ dùng lớp lưới hình chữ nhật vô hình phủ lên trang để theo dõi chuột. Mỗi ô có một ảnh nền riêng được kích hoạt khi hover.
  • Một người bình luận khác chỉ trích việc chỉ đơn giản hash ngày và IP để ẩn danh địa chỉ IP là kiểu “security theater”, và chỉ ra rằng hash mật mã được thiết kế để tính nhanh nên có thể bị tấn công vét cạn nhằm tìm ra địa chỉ IP.
  • Một người dùng lưu ý rằng phương pháp body:hover nhiều khả năng sẽ bỏ sót phần lớn người dùng “chỉ dùng bàn phím” và các user agent không dùng thiết bị con trỏ (công nghệ hỗ trợ), đồng thời nhấn mạnh cần có một cách tiếp cận bao quát hơn.
  • Một người dùng khác tin rằng nếu phân tích bằng CSS trở nên phổ biến, người dùng cũng sẽ chán toàn bộ khái niệm phân tích và cố tìm cách lách nó.
  • Một số người bình luận khen ngợi cách dùng CSS đầy khéo léo cho phân tích, đồng thời chia sẻ những thử nghiệm tương tự của riêng họ, chẳng hạn dùng thẻ <img> để tải hình ảnh giả.
  • Một người dùng đặt câu hỏi về mục tiêu của việc thu thập dữ liệu phân tích trong bối cảnh phi thương mại, chẳng hạn với blog cá nhân.
  • Một người dùng khác đề xuất lấy thông tin này từ máy chủ HTTP thay vì dùng phân tích bằng CSS.