- Bài viết về việc sử dụng ChatGPT API để trích xuất các gợi ý sách từ các luồng thảo luận trên Hacker News (HN)
- Tác giả đã phân tích gần 200 câu chuyện trên HN có chứa từ "book" trong tiêu đề và không liên kết tới trang khác
- Tác giả dùng GPT API để phân loại dữ liệu và xuất thông tin ở định dạng JSON
- Dữ liệu được lấy từ Hacker News API, và tác giả gọi Chat Completions API để trích xuất tiêu đề sách, tác giả và URL từ văn bản
- Danh sách 50 gợi ý sách hàng đầu đã được đưa ra, trong đó "Structure and Interpretation of Computer Programs" của Abelson và Sussman là cuốn được đề xuất nhiều nhất
- Đôi khi API không trả về JSON hợp lệ, đặc biệt khi ChatGPT phản hồi các bình luận kiểu "thanks" hoặc đặt câu hỏi
- Tác giả đã thiết kế prompt để loại bỏ các phản hồi không có tiêu đề, vì đôi khi ChatGPT chỉ nêu tên tác giả mà không có tiêu đề sách cụ thể
- Việc xử lý 57k bình luận bằng GPT 3.5 Turbo API tốn khoảng 40 USD
- Tác giả nhận thấy ngay cả khi đặt nhiệt độ bằng 0, kết quả của GPT vẫn khác nhau giữa các lần gọi và cho thấy độ biến thiên lớn hơn so với mô hình GPT-3 trước đó
- Tác giả phát hiện GPT có thể nhận diện liên kết trong văn bản, nhưng cần loại bỏ thẻ HTML để tránh việc nó chọn phần văn bản liên kết bị cắt thay vì URL
- Tác giả đã chia sẻ ví dụ về đầu ra JSON do ChatGPT tạo ra và prompt được dùng cho tác vụ này
- Dữ liệu thô do GPT tạo ra đã được chia sẻ, được sắp xếp theo tiêu đề để phục vụ phân tích thêm
- Tác giả đã thêm liên kết liên kết tiếp thị Amazon vào các URL Amazon trong bảng như một bài tập học tập
1 bình luận
Ý kiến trên Hacker News