14 điểm bởi xguru 2021-05-29 | 1 bình luận | Chia sẻ qua WhatsApp
  • RDBMS cho phân tích

  • Tốc độ nhanh gần như theo thời gian thực, có khả năng mở rộng, ổn định

→ Nhanh hơn 5x~24x so với các CSDL dạng cột hiện có (Vertica,Greenplum)

→ Nhanh hơn 100x~1000x so với Hive hoặc MySQL

  • Thiết lập dễ dàng

  • Tính năng phong phú: thực thi truy vấn phân tán/song song, xử lý truy vấn thời gian thực, nén dữ liệu, tách riêng lưu trữ Hot/Cold, truy vấn tài liệu JSON, distributed Join, lưu trữ đối tượng tương thích S3..

  • Chịu lỗi: sao chép bất đồng bộ đa master

  • Độ tin cậy cao: hệ thống phân tán không có SPOF

  • Tận dụng tối đa phần cứng: tận dụng tối đa lệnh CPU SIMD, giảm thiểu truy cập ổ đĩa/truyền dữ liệu, v.v.

1 bình luận

 
xguru 2021-05-29

Xây dựng pipeline phân tích dựa trên ClickHouse

https://medium.com/delightroom/…