xsv - Công cụ xử lý tệp CSV cho CLI
(github.com)Công cụ CLI giúp dùng tệp CSV như một cơ sở dữ liệu. Mã nguồn mở Rust
Gộp tệp, đếm số dòng, tạo độ rộng cố định, định dạng lại (thay đổi dấu phân cách, v.v.),
join (inner, outer, cross), phân vùng theo giá trị cột, lấy mẫu, đảo ngược, trích xuất cột cụ thể, sắp xếp lại thứ tự cột,
sort, chia nhỏ (thành N tệp), stats (trung bình, phương sai, trung vị, phạm vi, v.v. cho từng cột), xem dưới dạng bảng
2 bình luận
spark trên local?!
Có vẻ sẽ hữu ích khi làm sạch dữ liệu CSV trong quá trình phân tích dữ liệu.
Ví dụ join theo kiểu SQL - https://www.johndcook.com/blog/2019/12/31/sql-join-csv-files/