Tuplex - Khung xử lý dữ liệu lớn song song
(github.com)- Cung cấp API Python tương tự Apache Spark / Dask nhưng
→ không gọi trình thông dịch Python
→ tạo bytecode LLVM được tối ưu hóa cho pipeline và tập dữ liệu đầu vào đã cho
→ nhanh hơn 5~91 lần so với trình thông dịch
-
Bên trong, dựa trên biên dịch hướng dữ liệu và xử lý chế độ kép, nên đạt tốc độ tương đương với các pipeline được viết bằng C++ và tối ưu hóa
-
Hỗ trợ MacOS / Linux
-
Bài báo "Tuplex: Data Science in Python at Native Code Speed" được công bố tại SIGMOD '21
Chưa có bình luận nào.