Tính năng mong muốn như sau.
- Nhập liên kết Hacker News làm đầu vào
- Tóm tắt các bình luận rồi dịch sang tiếng Hàn. Khi dịch sang tiếng Hàn, mong phần kết câu theo kiểu như
haesseum,ham,doem.
Nếu mọi người chia sẻ, có lẽ sẽ có thêm nhiều bài được đăng trên GeekNews!
Xin cảm ơn.
4 bình luận
Vì lượng thông tin được cập nhật trên trang nhất Hacker News quá nhiều nên mình cũng hơi lo khi dùng LLM.
Lần này
gpt-4.1-nanovừa được phát hành có mức giá điên rồ là 0,1 USD cho 1M token đầu vào, nên có vẻ hoàn toàn có thể làm tóm tắt/dịch/phân loại với chi phí rất rẻ.Mức giá này vô lý đến mức mình đã đăng lên blog của mình bài so sánh giá giữa API dịch và model 4.1-nano rồi.
Nếu bạn quan tâm thì có thể xem thử: https://dev-wiki.dev/reading/tech/16
Thành thật mà nói, khi dùng model nano, tôi xem việc trích xuất/tóm tắt/phân loại trên dữ liệu đã được tinh lọc thay vì nhét cả đống thẻ HTML nguyên khối vào gần như là miễn phí nên cứ dùng thôi ạ
Nếu bật cài đặt chia sẻ token thì có lẽ sẽ được miễn phí 2,5 triệu token, với 4.1 mini và nano.
Có dễ xác định vị trí bình luận trong HTML không?
Nếu dùng thứ như firecrawl cho cả phần này thì có vẻ sẽ cực kỳ tốn tiền.
Nếu có thể xử lý các thẻ HTML khéo léo để xác định được phần cụ thể, thì sau đó có lẽ có thể dùng nội dung đó với mô hình nano để làm điều mình muốn.