12 puan yazan xguru 2024-12-27 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Farklı kaynaklardan veri toplama, SQL ve Python ile veri dönüştürme ve veri kalitesi kontrolleri ekleyerek uçtan uca akış kurmaya yönelik birleşik bir çerçeve
    • Bunu tek bir yapıda dbt + Airbyte + Great Expectations benzeri şekilde sunuyor
  • Go ile yazılmış bir CLI ve onunla entegre çalışan VS Code eklentisinden oluşuyor. VS Code içinde hat oluşturma, yönetme ve dağıtım mümkün
  • Veri toplama için ingestr kullanılıyor
    • ingestr, Python ile yazılmış ayrı bir açık kaynak CLI; veri kaynakları arasında kolay kopyalama işlemlerini yönetiyor
    • Desteklenenler: AWS Athena, Databricks, DuckDB, Google BigQuery, Microsoft SQL Server, Postgres, Redshift, Snowflake, Synapse, Pager
  • SQL ve Python kullanarak veri dönüştürme (dbt'ye benzer)
  • Python ortam yönetimi için uv kullanılıyor. İzole şekilde çalıştırıyor
  • Veri kalitesi kontrolleri yerleşik olarak geliyor
  • Jinja şablonlarını destekliyor
  • dry-run desteği sayesinde veri hattını baştan sona doğrulamak mümkün
  • Yerel makinede, EC2 instance'larında ve GitHub Actions üzerinde çalışabiliyor
  • Ortam değişkenleriyle secret injection desteği
  • Çeşitli tablo/görünüm materialization stratejilerini destekliyor; incremental tablolar dahil

Henüz yorum yok.

Henüz yorum yok.