8 puan yazan xguru 2021-09-16 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Analitik mühendislerinin farklı veri silolarını birbirine bağlayarak birleşik bir görünüm oluşturması mümkün

→ Veri birleştirme için no-code ML aracı

  • Neden gerekli?

→ Gerçek verilerde bir müşteri için birden fazla kayıt bulunur

→ Her kayıt tekli/çoklu sistemlere dağılmış olduğundan veri büyüdükçe müşteri analizi zorlaşır

→ ELT'deki T aşaması çok emek gerektirir ve dbt gibi araçlar bunu başarıyla ele alabilir

→ Hızlı ve ölçeklenebilir bir yöntemle, temel iş nesneleri için çıkarma veya yükleme öncesinde "Single Source of Truth oluşturmak" gerekir

  • Yararlı kullanım alanları

→ Çoklu sistemlerde bulunan müşteriler için birleşik/güvenilir görünüm oluşturma

→ AML/KYC gibi alanlarda büyük ölçekli varlık doğrulama

→ Tekilleştirme ve veri kalitesi

→ Veri silolarını birleştirme

→ Harici kaynak verilerini zenginleştirme

  • Desteklenen kaynaklar

→ Snowflake, Cassandra, S3, Azure, Elastic, başlıca RDBMS'ler ve Spark destekli veri kaynakları

→ Parquet, Avro, JSON, XLSX, CSV, TSV gibi dosyalar da desteklenir

Henüz yorum yok.

Henüz yorum yok.