Tuplex - Khung xử lý dữ liệu lớn song song

xguru · 2021-07-09T09:20:53+09:00

Cung cấp API Python tương tự Apache Spark / Dask nhưng → không gọi trình thông dịch Python → tạo bytecode LLVM được tối ưu hóa cho pipeline và tập dữ liệu đầu vào đã cho → nhanh hơn 5~91 lần so với trình thông dịch Bên trong, dựa trên biên dịch hướng dữ liệu và xử lý chế độ kép, nên đạt tốc độ tương đương với các pipeline được viết bằng C++ và tối ưu hóa Hỗ trợ MacOS / Linux Bài báo "Tuplex: Data Science in Python at Native Code Speed" được công bố tại SIGMOD '21

(github.com)

11 điểm bởi xguru 2021-07-09 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Cung cấp API Python tương tự Apache Spark / Dask nhưng

→ không gọi trình thông dịch Python

→ tạo bytecode LLVM được tối ưu hóa cho pipeline và tập dữ liệu đầu vào đã cho

→ nhanh hơn 5~91 lần so với trình thông dịch

Bên trong, dựa trên biên dịch hướng dữ liệu và xử lý chế độ kép, nên đạt tốc độ tương đương với các pipeline được viết bằng C++ và tối ưu hóa
Hỗ trợ MacOS / Linux
Bài báo "Tuplex: Data Science in Python at Native Code Speed" được công bố tại SIGMOD '21

Tuplex - Khung xử lý dữ liệu lớn song song

Bài viết liên quan

Chưa có bình luận nào.