- Analitik mühendislerinin farklı veri silolarını birbirine bağlayarak birleşik bir görünüm oluşturması mümkün
→ Veri birleştirme için no-code ML aracı
- Neden gerekli?
→ Gerçek verilerde bir müşteri için birden fazla kayıt bulunur
→ Her kayıt tekli/çoklu sistemlere dağılmış olduğundan veri büyüdükçe müşteri analizi zorlaşır
→ ELT'deki T aşaması çok emek gerektirir ve dbt gibi araçlar bunu başarıyla ele alabilir
→ Hızlı ve ölçeklenebilir bir yöntemle, temel iş nesneleri için çıkarma veya yükleme öncesinde "Single Source of Truth oluşturmak" gerekir
- Yararlı kullanım alanları
→ Çoklu sistemlerde bulunan müşteriler için birleşik/güvenilir görünüm oluşturma
→ AML/KYC gibi alanlarda büyük ölçekli varlık doğrulama
→ Tekilleştirme ve veri kalitesi
→ Veri silolarını birleştirme
→ Harici kaynak verilerini zenginleştirme
- Desteklenen kaynaklar
→ Snowflake, Cassandra, S3, Azure, Elastic, başlıca RDBMS'ler ve Spark destekli veri kaynakları
→ Parquet, Avro, JSON, XLSX, CSV, TSV gibi dosyalar da desteklenir
Henüz yorum yok.