19 điểm bởi xguru 2021-08-26 | 2 bình luận | Chia sẻ qua WhatsApp
  • Xử lý dữ liệu dạng named-index như CSV, TSV, Tabular JSON, v.v.

→ Cung cấp các chức năng của awk, sed, cut, join, sort cho dữ liệu key-value

  • Hữu ích cho việc làm sạch và rút gọn dữ liệu, lập thống kê, DevOps, quản trị hệ thống, xử lý tệp log, chuyển đổi định dạng tệp, hậu xử lý truy vấn DB, v.v.

→ Công cụ hỗ trợ xử lý đầu ra từ R, Pandas, SQL, v.v.

  • Hỗ trợ streaming và tích hợp tốt với Unix Pipe

  • Xử lý dữ liệu nội bộ bằng Insertion-Ordered Hash Map

  • Mã nguồn mở: ban đầu được viết bằng C, từ phiên bản 6.0 đã chuyển sang Go

2 bình luận

 
lordmiss 2021-08-27

Không phải là thứ tôi dùng thường xuyên, nhưng ngay cả khi chỉ mở tài liệu bên cạnh và dùng ngắt quãng, nó vẫn tốt hơn bất kỳ công cụ nào tôi từng dùng cho đến nay!

 
toughrogrammer 2021-08-26

Hay đấy. Trước giờ khi cần xử lý ad hoc các tệp CSV dung lượng lớn thì không có nhiều công cụ thật sự phù hợp, mà cái này trông cũng khá dễ dùng.