Documind - Công cụ AI mã nguồn mở chuyển tài liệu PDF thành dữ liệu có cấu trúc
(github.com/DocumindHQ)- Cung cấp các tính năng chuyển đổi PDF, trích xuất thông tin và định dạng kết quả theo schema do người dùng chỉ định
- Chuyển PDF thành hình ảnh để cho phép xử lý AI chi tiết hơn
- Sử dụng API của OpenAI để trích xuất và cấu trúc hóa thông tin
- Có thể tùy chỉnh schema trích xuất cho nhiều định dạng tài liệu khác nhau
- Được thiết kế để có thể triển khai linh hoạt cả trong môi trường cục bộ lẫn đám mây
- Được phát triển dựa trên Zerox
5 bình luận
Dù sao thì cũng là mã nguồn mở, nhưng dạo này AI chỉ toàn tăng tốc nên khá tiếc là không có nhiều công cụ nhẹ và miễn phí ra mắt nữa...
Thật tinh vi khi phần mềm siêu AI tiên tiến lại phụ thuộc vào Ghostscript đã 40 năm tuổi… haha
Chuyển văn bản thành PDF, rồi chuyển PDF thành hình ảnh, rồi lại chuyển hình ảnh thành văn bản nhỉ.
Đây là dịch vụ đang được phát triển để dùng nội bộ trong công ty... vậy mà giờ lại phát hành mã nguồn mở nhỉ haha
Có phải công ty của bạn là hk không?