Miller - Công cụ CLI để xử lý dữ liệu CSV/JSON
(github.com)- Xử lý dữ liệu dạng named-index như CSV, TSV, Tabular JSON, v.v.
→ Cung cấp các chức năng của awk, sed, cut, join, sort cho dữ liệu key-value
- Hữu ích cho việc làm sạch và rút gọn dữ liệu, lập thống kê, DevOps, quản trị hệ thống, xử lý tệp log, chuyển đổi định dạng tệp, hậu xử lý truy vấn DB, v.v.
→ Công cụ hỗ trợ xử lý đầu ra từ R, Pandas, SQL, v.v.
-
Hỗ trợ streaming và tích hợp tốt với Unix Pipe
-
Xử lý dữ liệu nội bộ bằng Insertion-Ordered Hash Map
-
Mã nguồn mở: ban đầu được viết bằng C, từ phiên bản 6.0 đã chuyển sang Go
2 bình luận
Không phải là thứ tôi dùng thường xuyên, nhưng ngay cả khi chỉ mở tài liệu bên cạnh và dùng ngắt quãng, nó vẫn tốt hơn bất kỳ công cụ nào tôi từng dùng cho đến nay!
Hay đấy. Trước giờ khi cần xử lý ad hoc các tệp CSV dung lượng lớn thì không có nhiều công cụ thật sự phù hợp, mà cái này trông cũng khá dễ dùng.