- LlamaCloud: Dịch vụ phân tách, thu thập và tìm kiếm có quản lý thế hệ mới. Được thiết kế để cung cấp Context-Augmentation cấp production cho ứng dụng LLM và RAG.
- LlamaParse: Công nghệ để phân tách các tài liệu phức tạp có chứa các đối tượng như bảng và biểu đồ. Tích hợp với LlamaIndex để cho phép xây dựng chức năng tìm kiếm cho tài liệu phức tạp và bán cấu trúc.
- API thu thập và tìm kiếm có quản lý: Cung cấp API giúp dễ dàng tải, xử lý và lưu trữ dữ liệu, đồng thời có thể sử dụng từ bất kỳ ngôn ngữ nào. Hoạt động dựa trên LlamaHub, LlamaParse và kho dữ liệu tích hợp.
RAG phụ thuộc vào chất lượng dữ liệu
- Cốt lõi của LLM là tự động hóa việc tìm kiếm, tổng hợp, trích xuất và lập kế hoạch kiến thức từ các nguồn dữ liệu không có cấu trúc.
- Để làm được điều đó, một kiến trúc dữ liệu mới đã ra đời: Retrieval-Augmented Generation (RAG), nhằm tải, xử lý và nhúng dữ liệu rồi nạp vào cơ sở dữ liệu vector.
- Ngăn xếp RAG khác với ngăn xếp ETL truyền thống và có tác động trực tiếp đến độ chính xác của hệ thống LLM.
- Việc bắt đầu dễ nhưng việc xây dựng RAG cấp production lại khó.
- Không tạo ra kết quả đáp ứng được nhu cầu.
- Quá nhiều tham số cần hiệu chỉnh.
- PDF có định dạng rối, đặc biệt là vấn đề.
- Việc đồng bộ hóa dữ liệu được cập nhật liên tục rất khó.
- LlamaCloud và LlamaParse được xây dựng như một pipeline dữ liệu để đẩy nhanh việc đưa ứng dụng RAG vào production.
LlamaParse
- LlamaParse là trình phân tích cú pháp tiên tiến giúp RAG diễn giải được bảng và biểu đồ nhúng trong tài liệu PDF phức tạp.
- Cho phép trả lời các câu hỏi về các tài liệu phức tạp mà trước đây không thể làm được bằng cách tiếp cận truyền thống.
API thu thập và tìm kiếm có quản lý
- Một trong những sản phẩm chủ lực khác của LlamaCloud, cho phép khai báo dễ dàng pipeline dữ liệu hiệu suất tốt và cung cấp dữ liệu sạch cho ứng dụng LLM.
- Mang lại lợi ích như tiết kiệm thời gian kỹ thuật, cải thiện hiệu suất và giảm độ phức tạp của hệ thống.
Đối tác ra mắt và cộng tác
- LlamaParse hợp tác với nhiều đối tác nhằm xây dựng các mối quan hệ đối tác lưu trữ và tính toán như Datastack, MongoDB, Qdrant, NVIDIA trong hệ sinh thái LLM và AI.
FAQ
- LlamaCloud không cạnh tranh với cơ sở dữ liệu vector, mà tập trung vào phân tách và thu thập dữ liệu. Nó đã tích hợp với hơn 40 cơ sở dữ liệu vector phổ biến.
- Lớp tìm kiếm là lớp điều phối chạy trên hệ thống lưu trữ hiện có.
Các bước tiếp theo
- LlamaParse có thể sử dụng ngay từ hôm nay trong bản xem trước công khai, còn LlamaCloud được cung cấp bản xem trước cá nhân cho các đối tác thiết kế doanh nghiệp có giới hạn.
1 bình luận
Ý kiến trên Hacker News
Là một thành viên trong nhóm phát triển LlamaParse, với kinh nghiệm trước đây trong việc xây dựng nhiều bộ trích xuất văn bản có cấu trúc từ PDF, LlamaParse có những điểm cải tiến so với các bộ trích xuất khác. Nó kết hợp OCR và trích xuất ký tự từ PDF, đồng thời kết hợp heuristic với các mô hình machine learning để tái cấu trúc tài liệu. Khi kết hợp với chiến lược tìm kiếm đệ quy, có thể thu được kết quả tốt nhất cho hỏi-đáp về các văn bản phức tạp.
LlamaParse đã phát triển một dịch vụ phân tích độc quyền rất xuất sắc trong việc parse PDF có bảng phức tạp thành định dạng Markdown có cấu trúc tốt. Sau khi một dự án mã nguồn mở trở nên nổi bật nhờ đóng góp của cộng đồng, liệu các nhà lãnh đạo dự án nhận vốn VC rồi tạo ra thứ độc quyền có phải là vấn đề?
Không hiểu vì sao đăng trên Medium. Medium giờ không còn đọc được nữa, và nên có một bài blog có thể tiếp cận được với độc giả.
Tò mò về hiệu năng của LlamaParse so với unstructured.io.
Trải nghiệm ban đầu với LlamaParse không thật sự ấn tượng. Có vấn đề chuyển hướng vô hạn khi đăng ký bằng email, và sau khi đăng nhập bằng Google thì bị thất vọng với trình parse PDF. Đã có quá nhiều lựa chọn rồi, nên tôi bối rối về việc vì sao cần dịch vụ này.
Có vẻ như LlamaParse đang cố giải quyết một bài toán khó. Rất nhiều khách hàng doanh nghiệp cần phải parse PDF và trích xuất dữ liệu chính xác. Giao diện có phần rối. LlamaParse dường như có thể trích xuất số trong bảng, nhưng đầu ra dường như không được trả về dưới dạng bảng và chỉ truy cập các số đó qua hỏi-đáp.
Có giống như AWS Textract không? Nó có thể phân tích và truy vấn thông tin từ bảng và biểu mẫu. Đối với LI, nó dễ dàng hóa lịch sử tìm kiếm cho workflow và RAG hơn cho người dùng, nhưng lại đặt ra câu hỏi tại sao phải phát minh lại bánh xe.
Nếu có thể sử dụng LLMs để trích xuất dữ liệu ngay từ đầu ở định dạng phù hợp nhất, tại sao phải xây dựng nó? Có thể có ý nghĩa trong ngắn hạn vì chi phí, nhưng về lâu dài đó là vấn đề mà LLMs nói chung có thể giải quyết.
LlamaParse giải quyết chính xác vấn đề tôi đã gặp lặp đi lặp lại liên quan đến RAG. Việc lấy thông tin có cấu trúc từ dữ liệu không có cấu trúc là rất khó.
Câu hỏi về giá cả sẽ như thế nào.