Yapay zekadan sonraki yazılım: Harness çağının başlangıcı
(tomtunguz.com)- Yazılım çağının sonu, harness çağının başlangıcı anlamına geliyor; sabit iş akışları ve yönetilen veritabanlarıyla çalışan SaaS, zekâ sahibi yapay zeka tarafından yer değiştiriyor
- Yapay zeka güçlü ama vahşi bir at gibi henüz evcilleştirilmemiş durumda; bu gücü kullanabilmek için sistematik kontrol (domestication) gerekiyor
- Yapay zeka ajanı harness'i, merkezdeki LLM'yi çevreleyen 7 temel bileşen ile tanımlanıyor ve her bileşen üretim düzeyindeki güvenilirlik ile performansı belirliyor
- Tüm şirketlerin aynı modellere erişebildiği bir çağda kazanan, modelin kendisi değil harness'i daha iyi tasarlayan ve işleten taraf (best rider) olacak
- Büyük laboratuvarların öncelik vermediği birbirinden ayrık binlerce pazar, startup'lar için fırsat olmaya devam ediyor
Harness çağının anlamı
- Yapay zeka, sabit iş akışlarına dayalı SaaS'ı ve yönetilen veritabanlarını zekâ (intelligence) ile değiştirerek yazılım paradigmasını yeniden tanımlıyor
- Yapay zeka bir mustang'e (vahşi at) benzetiliyor; güçlü ama sert olduğu için doğrudan kullanılamıyor ve onu evcilleştirme işi tam olarak harness oluyor
- Evcilleştirmenin özü, LLM'yi merkeze alıp çevresine 7 bileşeni radyal biçimde yerleştiren bir mimari
Yapay zeka ajanı harness'inin 7 bileşeni
-
1. Context & Memory (bağlam ve bellek)
- Genel amaçlı modeller için kullanıma özel özelleştirilmiş retrieval gerekli; bir radyolog için bağlam getirme sistemi ile bir hukuk asistanı için olan aynı olamaz
- Kısa süreli bellek ("ajan 45 saniye önce ne yapıyordu?"), büyük ölçekli görüntü arama (radyoloji·görüntü üretimi), milyarlarca dokümanda anahtar kelime arama gibi senaryolarda sistemler farklılaşıyor
- Retrieval'ın yanında, işin gerçekte nasıl yürüdüğünü barındıran bir bağlam veritabanı yer alıyor; bu, bir tür "tarif kitabı" işlevi görüyor
- İnsanların kafalarında taşıyarak işe geldikleri standart işletim prosedürleri (SOP), işte o tarifin kendisi
- İlk yakalama ve insanlarla süreçlerdeki değişime göre evrilme, bağlam veritabanının özünü oluşturuyor
-
2. Tools & Action (araçlar ve eylem)
- Araçlar, ajanın dış dünyayı etkilemesinin yolu; bağlam veritabanındaki tarif "ne yapılacağını" söylüyorsa, araçlar da bunu gerçekten yapmak için gereken malzeme ve ekipmanı sağlıyor
- Modern harness'ler araçları bir registry üzerinden açığa çıkarıyor; modelin verdiği argümanları doğruluyor, çağrıları dispatch ediyor, hassas işleri onay kapısından geçiriyor ve sonucu ajan döngüsüne parse ediyor
- MCP, araç bağlantıları için bir connective tissue olarak öne çıkıyor
- Harness'in kalitesi, güvenli biçimde açığa çıkarılabilen araç sayısı ve başarısızlıkları temiz şekilde ele alma becerisiyle belirleniyor
-
3. Orchestration & Loop (orkestrasyon ve döngü)
- Ajan döngüsü, düşün (think) → eyleme geç (act) → gözlemle (observe) → tekrarla (repeat) yapısına sahip
- Planlama, işi parçalara ayırma, alt ajanlar, yeniden denemeler ve durma koşulları; işin nasıl yapılacağını tanımlıyor
- Sistem kullandıkça iyileşmeli; her çalıştırmadan öğrenen closed-loop pattern, sağlayıcılar arasındaki ayrıştırıcı unsurlardan biri
-
4. State & Persistence (durum ve kalıcılık)
- Çok sayıda kişinin aynı anda sistemi kullandığı büyük ölçekli kurumsal ortamlarda dayanıklılık (resilient) zorunlu
- 10 adımlı bir işte harness 7. adımda çökerse, en baştan değil 8. adımdan devam edebilmesi gerekir
- Dosya sistemi, checkpoint'ler, oturum thread'leri ve artifact depoları; iş kaybını önleyen mekanizmalar
-
5. Sandbox & Compute (sandbox ve compute)
- Her ajan için bağımsız bir çalışma alanı (sandbox) gerekli
- İzole Unix çalışma alanları, kontrollü ağ çıkışı (egress) ve model dışında tutulan credentials; güvenlik, gizlilik ve büyük ölçekte hız sağlıyor
-
6. Observability & Governance (gözlemlenebilirlik ve yönetişim)
- "Göremediğin şeye güvenemezsin" — her adımın izlenmesi, her araç çağrısının log'lanması, evals'in regresyon testi olarak çalıştırılması ve en yüksek riskli kararlarda human-in-the-loop kullanımı; demoyu üretim sistemine dönüştüren şeyler
- Guardrails politikaları zorunlu kılar, Evals ise regresyonları müşteriden önce yakalar
-
7. Cost & Workflow Optimization (maliyet ve iş akışı optimizasyonu)
- Yedinci bileşen, mimari yargı (architectural judgment)
- Hangi alanların deterministik, hangilerinin deterministik olmayan biçimde ele alınacağını ayırma; adım bazında uygun modeli seçme (en ileri, orta, küçük, fine-tuned) ve bilginin beceride mi yoksa bellekte mi tutulacağına karar verme
Yeni rekabet düzeni
- Ortaya çıkan sonuç, yazılım için yeni bir rekabet dinamiği; ancak bu her kategoriye aynı şekilde uygulanmıyor
- Büyük laboratuvarların (başlıca yapay zeka araştırma merkezleri) öncelik verdiği pazarlar, hızlı uygulama kapasitesi ve model üzerinde doğrudan kontrol avantajından yararlanıyor
- Ancak bunun dışındaki birbirinden ayrı binlerce pazar, startup'lara açık durumda
- Her şirketin aynı modeli kullanabildiği bir çağda "en iyi sürenler (best riders)" kazanacak — yani asıl rekabet gücü harness tasarlama ve işletme yetkinliği
Henüz yorum yok.