Tuplex - Paralel büyük veri işleme çerçevesi
(github.com)- Apache Spark / Dask benzeri bir Python API'si sunuyor, ancak
→ Python yorumlayıcısını çağırmıyor
→ Verilen pipeline ve girdi veri kümesine optimize edilmiş LLVM bytecode üretiyor
→ Yorumlayıcıya kıyasla 5~91x daha hızlı
-
Dahili olarak data-driven derleme ve dual-mode işlemeye dayanıyor; bu sayede C++ ile kodlanmış ve optimize edilmiş pipeline'lara benzer hız sağlıyor
-
MacOS / Linux destekli
-
SIGMOD '21'de sunulan "Tuplex: Data Science in Python at Native Code Speed" makalesi
Henüz yorum yok.