17 điểm bởi bamchi 2023-08-29 | 5 bình luận | Chia sẻ qua WhatsApp
  • Phát triển bot crawl dùng ChatGPT để thu thập thông tin sản phẩm trên Coupang
    • Các cột cần thu thập gồm tên sản phẩm, giá niêm yết, giá bán, điểm đánh giá, số lượng review, thông tin giảm giá thẻ, thông tin tích điểm, thông tin giao hàng
  • Cách giảm kích thước HTML để tránh giới hạn số lượng token và những điểm cần lưu ý khi viết prompt
  • Bỏ qua sản phẩm quảng cáo
  • Xử lý ngoại lệ khi cấu trúc DOM khác nhau
  • Kiểm tra các cột bắt buộc (tên sản phẩm, giá)
  • ChatGPT là một công cụ cực kỳ hữu ích, nhưng vẫn cần một chút debug và chỉnh sửa (rốt cuộc chuyên gia vẫn sẽ nhận được nhiều trợ giúp hơn)
  • Cần cân nhắc việc né chặn để thu thập dữ liệu quy mô lớn

5 bình luận

 
freedomzero 2023-08-30

Có vẻ như ngay cả bài viết này cũng được viết hoàn toàn bằng GPT.

 
roxie 2023-08-30

(Rốt cuộc thì người hưởng lợi nhiều hơn vẫn là chuyên gia)

Có vẻ như có thể tóm gọn như vậy..

 
superyang 2023-08-30

Tôi đang tạo một crawler bằng ChatGPT và nhận được rất nhiều hỗ trợ trong việc phân tích cú pháp cũng như trích xuất XPath.

 
kernel00 2023-08-30

Bài viết nói về việc tạo trình thu thập dữ liệu bằng GPT, nhưng rốt cuộc lại chỉ là quảng cáo cho HashScraper.

 
superwoou 2023-08-30

Mấy blog công nghệ chẳng phải đều như vậy sao.. hì hì