Airflow’u büyük ölçekte işletirken öğrenilen dersler
(shopify.engineering)Shopify bunu veri çıkarma, makine öğrenimi modeli eğitimi, Apache Iceberg tablo bakımı ve DBT tabanlı veri modelleme gibi işler için kullanıyor
- Bulut depolama kullanıldığında dosya erişimi yavaş olabilir
→ GCS + NFS ile performansı iyileştirme - Meta veri hacmi büyüdüğünde Airflow operasyonları yavaşlayabilir
→ Retention politikası kullanarak 28 gün olarak ayarlama - DAG’leri kullanıcılar ve ekiplerle ilişkilendirmek zor olabilir
→ Merkezi bir meta veri deposu kullanma - DAG yazarları çok fazla yetkiye sahip olur
→ DAG policy kullanma - Tutarlı yük dengelemesini garanti etmek zordur
→ Trafik patlamalarını azaltmak için standartlaştırılmış zamanlamalar oluşturma - Birden fazla kaynak çekişmesi noktası vardır
→ Pools, Priority Weight, Celerey Queue ve Isolated Workers kullanma
Henüz yorum yok.