2 điểm bởi the0807 2025-04-12 | 2 bình luận | Chia sẻ qua WhatsApp

Dự án này là một máy chủ Model Context Protocol (MCP) dùng để lấy các bài viết từ GeekNews. Nó được triển khai bằng Python và sử dụng BeautifulSoup để thực hiện web scraping.

Tính năng chính

  • Thu thập tin mới nhất: Thông qua công cụ get_articles, bạn có thể lấy số lượng bài viết mong muốn từ nhiều danh mục khác nhau của GeekNews (top, new, ask, show). Mỗi bài viết bao gồm tiêu đề, URL, điểm, tác giả, thời gian, số lượng bình luận và thông tin thứ hạng.
  • Tóm tắt tin tức hằng tuần: Sử dụng công cụ get_weekly_news để chỉ định một ID bản tin tuần cụ thể hoặc lấy bản tin tuần mới nhất. Tin tức hằng tuần bao gồm các thông tin như tiêu đề, số, ID, nội dung, URL, danh sách mục, v.v.; mỗi mục bao gồm tiêu đề, URL và thông tin thứ hạng.

2 bình luận

 
xguru 2025-04-13

Có vẻ đây là một dự án hữu ích, và tôi hoàn toàn đồng cảm với ý định muốn tận dụng nội dung của GeekNews.
Tuy nhiên, GeekNews cấm các hành vi gây tải cho trang web như truy cập tự động hóa.

Nếu có thể, chúng tôi sẽ rất cảm kích nếu bạn cân nhắc theo hướng không gây tải trực tiếp lên trang web (ví dụ: sử dụng dữ liệu đã được cache).

 
the0807 2025-04-13

Cảm ơn bạn đã đánh giá đây là một dự án hữu ích. Như bạn đã nói, chúng tôi sẽ tìm kiếm phương án cải thiện theo hướng tận dụng dữ liệu đã được cache để không gây tải trực tiếp lên trang web. Xin cảm ơn.