- Thư viện giúp phân đoạn các tài liệu phức tạp một cách dễ dàng như con người
- Chunking tài liệu là nền tảng của mọi hệ thống RAG, nhưng phần lớn mã nguồn mở đều có giới hạn khi xử lý tài liệu phức tạp
- Open Parse được thiết kế để lấp đầy khoảng trống này bằng cách cung cấp một thư viện linh hoạt và dễ sử dụng, có thể nhận diện trực quan bố cục tài liệu và phân đoạn hiệu quả
Các tính năng chính của Open Parse
- Dựa trên thị giác (Visually-Driven): Vượt xa việc chỉ phân tách văn bản đơn thuần, phân tích tài liệu một cách trực quan để tạo đầu vào tốt hơn cho LLM
- Hỗ trợ Markdown: Hỗ trợ Markdown gốc để phân tích tiêu đề, chữ đậm và chữ nghiêng
- Hỗ trợ bảng độ chính xác cao: Trích xuất bảng sang định dạng Markdown sạch với độ chính xác vượt trội so với các công cụ hiện có
- Khả năng mở rộng: Có thể dễ dàng triển khai các bước hậu xử lý tùy chỉnh
- Trực quan: Hỗ trợ editor tốt và tự động hoàn thành ở mọi nơi giúp giảm thời gian debug
- Dễ dùng: Được thiết kế để dễ sử dụng và dễ học, giúp rút ngắn thời gian đọc tài liệu
Chưa có bình luận nào.