2021'de 5 veri trendi
(towardsdatascience.com)-
Veri gölü ve veri ambarının birleşimi: Data Lakehouse
-
"Modern veri yığını" ana akım haline geliyor: bulut tabanlı başlıca araçların entegrasyonu
→ Data Ingestion : Fivetran, Stitch, Hevodata
→ Data Warehouse : Snowflake, BigQuery
→ Data Lake : Amazon S3
→ Data Lake Processing : Presto, Dremio, Databricks, Starburst
→ Data Transformation : dbt, Matillion
→ Metadata Management : Atlan
→ BI Tools : Looker
- Metadata 3.0: metadata yönetiminin yeniden doğuşu
→ Veri keşfi, veri kataloğu, veri lineage'ı, observability gibi alanları ele almak için araçlar yükselişe geçecek
- Yeni mesleklerin yükselişi
→ Data Platform Leader : kurum içinde veri platformunun iş süreçlerine uygulanmasına yardımcı olan lider
→ Analytics Engineer : dbt gibi araçların ortaya çıkmasıyla, yalnızca analiz değil veri yığınını da yöneten analiz mühendisleri mümkün hale geliyor
- Veri kalitesi framework'lerinin yükselişi
→ Veri profilleme: veriyi inceleme, kaliteyi doğrulama ve gelecekteki kullanım yöntemlerini belirleme
→ İş odaklı veri kalitesi kurallarının tanımlanması
→ Veri pipeline'larında kalite testlerinin uygulanması: Amazon Deequ, Great Expectations
2 yorum
https://youtube.com/playlist/?list=PLL-_zEJctPoJ92HmbGxFv1Pv_ugsggGD2
"En Yeni Veri Altyapısını Anlamak" serisi her yayımlandığında dikkatle dinliyorum.
Her gün yalnızca kullandığım şeyleri kullandığım için yeni akımlarla karşılaşmak zor oluyor; bunları bu kadar iyi açıkladığınız için teşekkür ederim.