warc-parquet - CLI chuyển đổi WARC sang Parquet (github.com/maxcountryman) 8 điểm bởi xguru 2022-06-30 | 1 bình luận | Chia sẻ qua WhatsApp Chuyển đổi tệp Web ARChive (.warc) sang định dạng Apache Parquet dạng cột Có thể nạp Parquet vào DuckDB để truy vấn thuận tiện Mã nguồn mở Rust Bài viết liên quan WarcDB - Dữ liệu web crawl dưới dạng CSDL SQLite 14 điểm · 0 bình luận · 2022-06-22 Carquet - Thư viện C thuần hiệu năng cao để đọc và ghi tệp Parquet 9 điểm · 0 bình luận · 2026-01-17 dir2md v1.0.4 — CLI chuyển đổi codebase mã nguồn mở thành Markdown thân thiện với LLM, bản cập nhật lớn 8 điểm · 0 bình luận · 2025-10-10 Broot - công cụ CLI mới để điều hướng cây thư mục phức tạp 7 điểm · 3 bình luận · 2020-01-10 DuckLake - Định dạng hồ dữ liệu và catalog hợp nhất 13 điểm · 1 bình luận · 2025-05-29 1 bình luận xguru 2022-06-30 DuckDB - mã nguồn mở OLAP DB nhúng Khá giống với WarcDB - Web crawl data as SQLite DB mới được đăng cách đây không lâu. Tuy vậy, ở những nơi đã có sẵn hạ tầng sử dụng Parquet thì có vẻ sẽ thuận tiện hơn để dùng.
1 bình luận
DuckDB - mã nguồn mở OLAP DB nhúng
Khá giống với WarcDB - Web crawl data as SQLite DB mới được đăng cách đây không lâu.
Tuy vậy, ở những nơi đã có sẵn hạ tầng sử dụng Parquet thì có vẻ sẽ thuận tiện hơn để dùng.