- Çeşitli kaynak ve formatlardan veriyi çıkarmak, hazırlamak ve düzenlemek için tasarlanmış Python tabanlı ETL
- Hem yapılandırılmış hem de yapılandırılmamış dosyaları destekler (CSV, Parquet, PDF, Word, HTML vb.)
- Hem veri bilimcilerin hem de veri mühendislerinin sezgisel bir low-code arayüzle pipeline’ları kolayca geliştirebilmesini ve aynı zamanda her yerde dağıtılabilecek Python kodu üretebilmesini hedefliyor
- GUI ile veri pipeline’ları tasarlayıp on-premise/bulut fark etmeksizin her yere dağıtılabilecek yerel Python kodu üretir
- Dosyadan veritabanına veri entegrasyonu, veri bilimi ve LLM tabanlı sistemler için veri çıkarma ve hazırlama ile API alma ve zenginleştirme işlemlerinde üstün performans gösterir
1 yorum
Hacker News görüşleri