Lance - Định dạng dữ liệu dạng cột hiện đại được tối ưu cho quy trình ML
(github.com/lancedb)- Có thể chuyển đổi từ Parquet chỉ với 2 dòng code, hỗ trợ truy cập ngẫu nhiên nhanh hơn 100 lần, lập chỉ mục/tìm kiếm vector và quản lý phiên bản dữ liệu
- Tương thích với pandas, duckdb, polars, pyarrow, v.v.
- Zero-copy, tự động quản lý phiên bản
- Trường hợp sử dụng tối ưu
- Xây dựng công cụ tìm kiếm và feature store
- Huấn luyện các mô hình ML cỡ lớn cần IO hiệu năng cao và shuffle
- Lưu trữ/truy vấn/khảo sát dữ liệu lồng nhau phức tạp như robotics, Blob lớn (image, point-cloud, ..)
Chưa có bình luận nào.