Nemo - Nền tảng khám phá dữ liệu của Facebook
(engineering.fb.com)- Các tổ chức quy mô lớn thường tự xây dựng riêng công cụ tìm kiếm dữ liệu nội bộ và bộ máy metadata
→ Netflix(Metacat), Lyft(Amundsen), Linkedin(DataHub), Uber(Databook)
→ Nền tảng giúp dễ dàng tái sử dụng dữ liệu bằng cách tìm kiếm metadata như dữ liệu nào đã được ai/khi nào tìm kiếm/tạo ra
-
Tích hợp Hive, Scuba, Cubrick cùng nhiều dashboard và bộ dữ liệu AI
-
Sử dụng Unicorn, công cụ được dùng để tìm kiếm social graph
-
Hỗ trợ truy vấn ngôn ngữ tự nhiên bằng spaCy: "Instagram có bao nhiêu WAU (người dùng hoạt động hằng tuần)?"
1 bình luận
Nemo chưa được công bố dưới dạng mã nguồn mở, còn các công cụ của những công ty khác thì đã được phát hành mã nguồn mở.
Lyft - Amundsen https://github.com/amundsen-io/amundsen
Netflix - Metacat https://github.com/Netflix/metacat
Linkedin - DataHub https://github.com/linkedin/datahub