Data stack cho side project
(medium.com)-
Gợi ý các công cụ mã nguồn mở ETL/DW/BI dành cho những người đang học về dữ liệu
-
ETL/ELT
→ Thương mại: Fivetran, Stitch, Matillion
→ Mã nguồn mở: Meltano (by GitLab) + dbt + AirFlow
- BI
→ Thương mại: Tableau, Looker, PowerBI, Snowsight (Snowflake), Data Studio (Big Query), QuickSite (Athena)
→ Mã nguồn mở: Apache Superset
- DW
→ Thương mại: Snowflake, BigQuery, Athena
→ Mã nguồn mở: ở môi trường local thì PostgreSQL / SQLite, trên cloud thì BigQuery Free Tier
1 bình luận
Bài viết này được chia thành phần 1 và phần 2, nhưng vẫn khá ổn để hiểu về hiện trạng của data stack.