Paper to HTML - Chuyển đổi bài báo thành HTML dễ đọc
(papertohtml.org)<p>- Sử dụng machine learning để đọc nội dung từ PDF, LaTeX, PubMed Central XML và chuyển đổi sang HTML <br />
- Mục tiêu là tăng khả năng tiếp cận <br />
- Nguyên mẫu thử nghiệm của Semantic Scholar, công cụ tìm kiếm tài liệu nghiên cứu dựa trên AI <br />
- Hiện tại chỉ lưu đệm hình ảnh/nội dung đã trích xuất, và được dùng để phục vụ nhanh hơn cho những người tải lên cùng một tài liệu. Không lưu trữ tệp đã tải lên <br />
- Hạn chế<br />
→ Bảng (Table) được trích xuất dưới dạng hình ảnh <br />
→ Nội dung toán học (Math) có độ chính xác thấp hoặc hầu như không được trích xuất <br />
→ Xử lý LaTeX/PubMed có thể thiếu một số tính năng so với PDF <br />
- Trong tương lai có kế hoạch bổ sung tính năng trợ năng vào Semantic Scholar </p>
3 bình luận