12 điểm bởi xguru 2020-12-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Công cụ thu thập dữ liệu website trên máy cục bộ để hỗ trợ phân tích SEO

→ Kiểm tra thẻ H1, H2 và dữ liệu Meta

→ Trích xuất thông tin từ từng trang bằng XPath và bộ chọn CSS

→ Kiểm tra trạng thái bằng trình phân tích Robots.txt

→ Kiểm tra liên kết hỏng và mã trạng thái (3xx, 4xx, 5xx)

→ Có thể loại trừ URL bằng bộ lọc

  • Cung cấp tệp thực thi cho Windows/Mac/Linux

  • Xuất kết quả thu thập dữ liệu ra CSV ( tự lưu vào sqlite )

  • Có thể chạy cả trên máy cấu hình thấp và không có giới hạn kích thước

→ Đã hoàn tất kiểm thử với các trang web có hơn 4 triệu trang

  • Cũng được cung cấp dưới dạng mã Python và gói pypi ( pip install greenflare )

1 bình luận

 
xguru 2020-12-11

Thử nghiệm thì thấy công cụ thu thập và xử lý các URL khá nhanh.

Đọc 5000 URL cũng không mất bao lâu.

Phía máy chủ có thể vẫn bị tải, nên hãy dùng nhẹ tay. ^^