11 puan yazan GN⁺ 2026-02-25 | 1 yorum | WhatsApp'ta paylaş
  • Yapay zeka kod yazımını ve pipeline oluşturmayı otomatikleştirdikçe, veri mühendisliğinin odağı basit veri taşımadan ziyade anlamı (meaning) ele almaya kayıyor
  • Mevcut ETL (Extract, Transform, Load) yapısı verinin anlamını koruyamıyor; bunun yerine yeni bir çerçeve olarak ECL (Extract, Contextualize, Link) öne çıkıyor
  • ECL, veri çıkarımından sonra bağlamsallaştırma (Contextualize) ve bağlama (Link) yoluyla anlamı yapılandırıyor ve yapay zeka ile insan muhakemesini birleştiren anlam merkezli pipeline'lar kuruyor
  • Veri sözleşmesi (Data Contract), Contextualize pipeline'ı ve Context Store; verinin güvenilirliğini ve anlam tutarlılığını koruyan temel bileşenlerdir
  • Gelecekte veri mühendisi, yalnızca pipeline kuran kişi değil; 'Context Architect', yani veri anlamının mimarı olarak evrilmelidir

ETL çağının sınırları ve dönüşüm

  • ETL (Extract, Transform, Load), geçmişte sistemler arasında veri taşımak için kullanılan bir yapıydı; format uyumsuzluklarını ve silo sorunlarını çözmeye yönelikti
    • Ancak Transform aşamasında iş kuralları kodun içine gömülüyor, bu da yönetimi zorlaştırıyor; tanım değiştiğinde tüm pipeline'ın güncellenmesi gerekiyordu
  • Yapay zeka kod üretimini otomatikleştirdikçe, basit dönüşüm işleri artık ayırt edici bir unsur olmaktan çıkıyor
  • Veri mühendisliğinin özü, veri taşımak değil anlamı ele almak olarak yeniden tanımlanıyor

ECL — Extract, Contextualize, Link

  • Extract hâlâ gereklidir ve veri güvenilirliği, gecikme, hacim, hata modları gibi mimari kararlar gerektirir
  • Contextualize, veriye anlam kazandırma sürecidir; yapay zeka alan tanımlarını, varlık sınıflandırmasını ve ilişki çıkarımını yapar, insan ise bunu doğrular
    • Örneğin: “revenue” tanımı departmandan departmana değişebilir ya da null değerlerin anlamı sistemden sisteme farklı olabilir
  • Link, farklı sistemlerdeki varlıkları birbirine bağlayarak anlamın taşınabilir olmasını sağlayan süreçtir
    • Müşteri kayıtlarını, kullanıcı verilerini ve event log'ları bağlayarak bağlamsal tutarlılık sağlar

Early Binding — çalıştırılabilir veri sözleşmeleri

  • Early Binding, verinin üretildiği anda anlamın açıkça belirtilmesi yaklaşımıdır ve veri sözleşmeleri (Data Contract) ile hayata geçirilir
    • Sözleşme; şemayı, kalite beklentilerini, sahipliği ve alanların anlamını tanımlar
  • Bu, yalnızca dokümantasyon değil; hata anı tanımlanmış çalıştırılabilir kısıtlar (Executable Constraint) olarak çalışmalıdır
    • Şema değiştiğinde pipeline'ın başarısız olması, kalite ihlali olduğunda uyarı verilmesi gibi otomatik doğrulamalar içerir
  • Yapay zeka ortamında sözleşmedeki belirsizlik büyük ölçekli hatalara büyüdüğü için, açık sözleşmeler zorunludur

Early Binding'in sınırları

  • Medallion mimarisinde (Bronze–Silver–Gold) veri taşındıkça anlamı kademeli olarak kaybolur
    • Gold katmanı belirli sorular için optimize edilmiş bir çıktı olduğundan, orijinal anlam bozulabilir
  • Yalnızca Early Binding, anlamın kademeli aşınmasını engelleyemez
  • Bunu tamamlamak için Contextualize pipeline'ına ihtiyaç vardır

Late Binding — ajan tabanlı Contextualize pipeline'ı

  • Late Binding, iş kurallarının uygulanmasını sorgu anına erteler; ancak tanımların kendisi yine de önceden gerekliydi
  • Yeni yaklaşım, tanımların kendisinin özel bir pipeline tarafından dinamik biçimde üretilip doğrulanmasını sağlar
    • Event tabanlı tetikleyicilerle, yeni bir veri kümesi geldiğinde veya şema değiştiğinde otomatik çalışır
    • Yapay zeka ajanları, veri yapısını, örnekleri, istatistikleri ve lineage bilgisini analiz ederek anlam çıkarımı yapar
    • LLM-as-Judge, yüksek güvenli çıkarımları otomatik onaylar; belirsiz öğeler ise alan uzmanları tarafından incelenir
  • Doğrulanan sonuçlar Context Store içinde saklanır ve daha sonra tüm yapay zeka ve sorgular için anlam tabanlı referans noktası olarak kullanılır

Early vs Late Binding seçim ölçütleri

  • Kuruluş içinde kontrol edilebilen veriler için Early Binding uygundur
    • Sözleşme müzakere edilebilir ve zorunlu kılınabilir; açık anlam tanımları korunur
  • Harici veriler veya kontrol edilemeyen kaynaklar için, Contextualize pipeline'ı üzerinden Late Binding gerekir
    • Şema değişiklikleri ve anlam çıkarımının otomatikleştirilmesi gerekir
  • Temel ölçüt, kurumsal konum değil, 'hesap verebilirliğin (accountability)' varlığıdır
    • Hesap verebilirlik varsa Early Binding, yoksa Contextualize
  • Tekrarlanan doğrulamalar sayesinde keşfedilen anlam, resmî sözleşmeye yükseltilebilir

Context Propagation — pipeline değil röle yapısı

  • Anlam (Context), veri pipeline'ı boyunca taşınmaz; bunun yerine metadata ve lineage aracılığıyla paralel biçimde yayılır
  • Early Binding, kaynakta sözleşme metadata'sını ekler; lineage araçları bunu Bronze–Silver–Gold aşamalarına taşır
  • Contextualize pipeline'ı bu lineage'ı okuyarak anlam çıkarımı yapar ve doğrulanmış sonuçları Context Store içine kaydeder
  • Git benzetmesi: veri commit edilmiş dosyalardır, lineage git log gibidir, Context Store ise anlamın sürüm geçmişidir

Context Store — yeni mühendislik yüzeyi

  • Context Store, iş tanımlarının deposudur; wiki belgeleri gibi değil, doğrulanmış sürümlü artifact'ler şeklinde var olur
    • “revenue” tanımındaki çakışmalar güven temelli bir süreçle çözülür
  • Veri güvenilirliğinin kilit noktasıdır; anlamı bozulmuş veriyi tespit etmeyi ve düzeltmeyi mümkün kılar
  • Yapay zekanın ürettiği ve tükettiği verinin güvenilirliğini sağlamak için, Context Store yönetimi ve doğrulama workflow'larının tasarımı önemlidir
  • Ancak kurum içi sahiplik, çatışma uzlaştırma ve anlam yükseltme süreçleri hâlâ deneysel aşamadadır

Yeni veri mühendisi — Context Architect

  • Geleceğin veri mühendisi, anlam mimarisini tasarlayan kişi olacaktır
    • Sözleşme tasarımı, lineage altyapısının kurulması, Contextualize pipeline'ı ve Context Store yönetimi
    • Anlamın ne zaman açıkça tanımlanacağına ve ne zaman keşfedileceğine karar verme
  • Teknik rolün ötesinde, kurumlar arasında anlam paylaşımı ve sorumluluk yapısını tasarlayan bir koordinatör görevi üstlenir
  • Bu nedenle “veri mühendisi” yerine “Context Architect” adı daha uygundur

Açık frontier

  • ECL, tamamlanmış bir metodoloji değil; bir yönelimdir ve ilgili araçlar ile yönetişim modelleri hâlâ gelişmektedir
  • Sözleşmeleri çalıştırılabilir altyapı olarak ele alan ve lineage ile Context Store'u temel mühendislik varlıkları olarak yöneten organizasyonlar,
    önümüzdeki 10 yılda veri mühendisliği standartlarını tanımlayacak gibi görünüyor
  • Yapay zeka çağında da insanın üstlenmesi gereken alan 'mimari ve trade-off'lar' olmaya devam ediyor;
    bunun somut biçimi artık ECL ve Context Architect ile görünür hâle geliyor

1 yorum

 
onestone 2026-02-27

Geleneksel olarak teknisyenlerle benzer olan rolden alan uzmanına dönüşümün daha da hızlandığı görülüyor.