Nhìn RSS của Hacker News thì,
ngoài các nội dung liên quan đến kỹ thuật, còn có cả chính trị, tôn giáo và nhiều chủ đề lạ khác cũng xuất hiện, có mẹo hay cách nào để lọc bớt những thứ đó và chỉ đăng những bài đáng đọc không ạ?
Theo em nghĩ, những cách đáng thử là,
-
Áp dụng các bước bên dưới dựa trên một ngưỡng lượt xem hoặc điểm số nhất định
-
Nhìn URL rồi dùng công cụ crawl như firecrawl để lấy nội dung bài viết.
-
Đưa nội dung bài viết cho LLM đánh giá.
Chắc tầm này là phương án tốt nhất phải không nhỉ
5 bình luận
Hiện tại chắc việc tuyển chọn vẫn là chọn thủ công đúng không?
Thích đấy hahaha
haha hóa ra nguyên lý lại đơn giản hơn mình nghĩ
Cảm ơn : )
Mình cũng đang gặp vấn đề tương tự và thử xây dựng một giải pháp.
Mình đang làm một công cụ tên là Daigest(https://daige.st/).
Đúng như bạn nói, nó có cấu trúc như sau:
Ngoài Hacker News, còn có thể theo dõi Reddit, blog, v.v.
Hiện có thể dùng miễn phí, nên mình khuyên bạn thử một lần nhé 🙏