2 điểm bởi GN⁺ 2023-10-05 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bài viết về việc sử dụng ChatGPT API để trích xuất các gợi ý sách từ các luồng thảo luận trên Hacker News (HN)
  • Tác giả đã phân tích gần 200 câu chuyện trên HN có chứa từ "book" trong tiêu đề và không liên kết tới trang khác
  • Tác giả dùng GPT API để phân loại dữ liệu và xuất thông tin ở định dạng JSON
  • Dữ liệu được lấy từ Hacker News API, và tác giả gọi Chat Completions API để trích xuất tiêu đề sách, tác giả và URL từ văn bản
  • Danh sách 50 gợi ý sách hàng đầu đã được đưa ra, trong đó "Structure and Interpretation of Computer Programs" của Abelson và Sussman là cuốn được đề xuất nhiều nhất
  • Đôi khi API không trả về JSON hợp lệ, đặc biệt khi ChatGPT phản hồi các bình luận kiểu "thanks" hoặc đặt câu hỏi
  • Tác giả đã thiết kế prompt để loại bỏ các phản hồi không có tiêu đề, vì đôi khi ChatGPT chỉ nêu tên tác giả mà không có tiêu đề sách cụ thể
  • Việc xử lý 57k bình luận bằng GPT 3.5 Turbo API tốn khoảng 40 USD
  • Tác giả nhận thấy ngay cả khi đặt nhiệt độ bằng 0, kết quả của GPT vẫn khác nhau giữa các lần gọi và cho thấy độ biến thiên lớn hơn so với mô hình GPT-3 trước đó
  • Tác giả phát hiện GPT có thể nhận diện liên kết trong văn bản, nhưng cần loại bỏ thẻ HTML để tránh việc nó chọn phần văn bản liên kết bị cắt thay vì URL
  • Tác giả đã chia sẻ ví dụ về đầu ra JSON do ChatGPT tạo ra và prompt được dùng cho tác vụ này
  • Dữ liệu thô do GPT tạo ra đã được chia sẻ, được sắp xếp theo tiêu đề để phục vụ phân tích thêm
  • Tác giả đã thêm liên kết liên kết tiếp thị Amazon vào các URL Amazon trong bảng như một bài tập học tập

1 bình luận

 
GN⁺ 2023-10-05
Ý kiến trên Hacker News
  • Bài viết trên Hacker News về việc trích xuất thông tin gợi ý sách bằng ChatGPT API
  • Một số người dùng chỉ ra rằng ChatGPT đã bỏ sót một vài gợi ý sách
  • Người dùng dùng từ khóa "books" để tìm kiếm gợi ý sách trên Hacker News và khen chất lượng các gợi ý tìm được trên nền tảng
  • Người dùng nhắc đến các tài nguyên gợi ý sách khác như Hacker Recommended Books và Hacker News Books
  • Một số người dùng bày tỏ sự ngạc nhiên khi một số cuốn như 'Code' của Charles Petzold và các sách của Knuth không có trong danh sách top 50
  • Có lo ngại về chất lượng của các gợi ý sách do AI tạo ra; một số người dùng cho rằng chúng có thể được dùng để tạo liên kết affiliate Amazon
  • Một số người dùng đặt câu hỏi về việc một số sách như 'How to Win Friends and Influence People' và 'Atlas Shrugged' được đưa vào danh sách
  • Một người dùng chỉ ra rằng 'Meditations' của Marcus Aurelius có thể đã bị nhầm với 'Meditations on First Philosophy' của Descartes, khiến danh sách có thể có lỗi
  • Một số người dùng tìm thấy giá trị ở các gợi ý sách ít phổ biến hơn được tìm thấy trong phần bình luận của các bài đăng trên Hacker News
  • Có ý kiến nghi ngờ sự cần thiết của việc dùng ChatGPT, khi một số người dùng cho rằng chỉ cần Algolia và phân tích dữ liệu là đủ