8 điểm bởi xguru 2021-09-16 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Giúp kỹ sư phân tích có thể kết nối nhiều data silo khác nhau để tạo ra một góc nhìn hợp nhất

→ Công cụ ML no-code cho hợp nhất dữ liệu

  • Vì sao cần nó?

→ Trong dữ liệu thực tế, một khách hàng thường có nhiều bản ghi

→ Mỗi bản ghi được phân tán trên một hoặc nhiều hệ thống, nên khi dữ liệu tăng lên thì việc phân tích khách hàng trở nên khó khăn

→ Trong ELT, chữ T đòi hỏi rất nhiều công sức, và các công cụ như dbt có thể xử lý việc này khá thành công

→ Cần một cách nhanh và có khả năng mở rộng để "tạo ra Single Source of Truth trước khi trích xuất hoặc nạp dữ liệu" cho các đối tượng kinh doanh chính

  • Các trường hợp hữu ích

→ Tạo góc nhìn hợp nhất/đáng tin cậy về khách hàng nằm trên nhiều hệ thống

→ Xác minh thực thể ở quy mô lớn như AML/KYC

→ Loại bỏ trùng lặp và nâng cao chất lượng dữ liệu

→ Hợp nhất các data silo

→ Enrichment dữ liệu từ các nguồn bên ngoài

  • Các nguồn được hỗ trợ

→ Snowflake, Cassandra, S3, Azure, Elastic, các RDBMS phổ biến và các nguồn dữ liệu được Spark hỗ trợ

→ Cũng hỗ trợ các tệp như Parquet, Avro, JSON, XLSX, CSV, TSV

Chưa có bình luận nào.

Chưa có bình luận nào.