1 puan yazan GN⁺ 1 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Yazılım çağının sonu, harness çağının başlangıcı anlamına geliyor; sabit iş akışları ve yönetilen veritabanlarıyla çalışan SaaS, zekâ sahibi yapay zeka tarafından yer değiştiriyor
  • Yapay zeka güçlü ama vahşi bir at gibi henüz evcilleştirilmemiş durumda; bu gücü kullanabilmek için sistematik kontrol (domestication) gerekiyor
  • Yapay zeka ajanı harness'i, merkezdeki LLM'yi çevreleyen 7 temel bileşen ile tanımlanıyor ve her bileşen üretim düzeyindeki güvenilirlik ile performansı belirliyor
  • Tüm şirketlerin aynı modellere erişebildiği bir çağda kazanan, modelin kendisi değil harness'i daha iyi tasarlayan ve işleten taraf (best rider) olacak
  • Büyük laboratuvarların öncelik vermediği birbirinden ayrık binlerce pazar, startup'lar için fırsat olmaya devam ediyor

Harness çağının anlamı

  • Yapay zeka, sabit iş akışlarına dayalı SaaS'ı ve yönetilen veritabanlarını zekâ (intelligence) ile değiştirerek yazılım paradigmasını yeniden tanımlıyor
  • Yapay zeka bir mustang'e (vahşi at) benzetiliyor; güçlü ama sert olduğu için doğrudan kullanılamıyor ve onu evcilleştirme işi tam olarak harness oluyor
  • Evcilleştirmenin özü, LLM'yi merkeze alıp çevresine 7 bileşeni radyal biçimde yerleştiren bir mimari

Yapay zeka ajanı harness'inin 7 bileşeni

  • 1. Context & Memory (bağlam ve bellek)

    • Genel amaçlı modeller için kullanıma özel özelleştirilmiş retrieval gerekli; bir radyolog için bağlam getirme sistemi ile bir hukuk asistanı için olan aynı olamaz
    • Kısa süreli bellek ("ajan 45 saniye önce ne yapıyordu?"), büyük ölçekli görüntü arama (radyoloji·görüntü üretimi), milyarlarca dokümanda anahtar kelime arama gibi senaryolarda sistemler farklılaşıyor
    • Retrieval'ın yanında, işin gerçekte nasıl yürüdüğünü barındıran bir bağlam veritabanı yer alıyor; bu, bir tür "tarif kitabı" işlevi görüyor
      • İnsanların kafalarında taşıyarak işe geldikleri standart işletim prosedürleri (SOP), işte o tarifin kendisi
      • İlk yakalama ve insanlarla süreçlerdeki değişime göre evrilme, bağlam veritabanının özünü oluşturuyor
  • 2. Tools & Action (araçlar ve eylem)

    • Araçlar, ajanın dış dünyayı etkilemesinin yolu; bağlam veritabanındaki tarif "ne yapılacağını" söylüyorsa, araçlar da bunu gerçekten yapmak için gereken malzeme ve ekipmanı sağlıyor
    • Modern harness'ler araçları bir registry üzerinden açığa çıkarıyor; modelin verdiği argümanları doğruluyor, çağrıları dispatch ediyor, hassas işleri onay kapısından geçiriyor ve sonucu ajan döngüsüne parse ediyor
    • MCP, araç bağlantıları için bir connective tissue olarak öne çıkıyor
    • Harness'in kalitesi, güvenli biçimde açığa çıkarılabilen araç sayısı ve başarısızlıkları temiz şekilde ele alma becerisiyle belirleniyor
  • 3. Orchestration & Loop (orkestrasyon ve döngü)

    • Ajan döngüsü, düşün (think) → eyleme geç (act) → gözlemle (observe) → tekrarla (repeat) yapısına sahip
    • Planlama, işi parçalara ayırma, alt ajanlar, yeniden denemeler ve durma koşulları; işin nasıl yapılacağını tanımlıyor
    • Sistem kullandıkça iyileşmeli; her çalıştırmadan öğrenen closed-loop pattern, sağlayıcılar arasındaki ayrıştırıcı unsurlardan biri
  • 4. State & Persistence (durum ve kalıcılık)

    • Çok sayıda kişinin aynı anda sistemi kullandığı büyük ölçekli kurumsal ortamlarda dayanıklılık (resilient) zorunlu
    • 10 adımlı bir işte harness 7. adımda çökerse, en baştan değil 8. adımdan devam edebilmesi gerekir
    • Dosya sistemi, checkpoint'ler, oturum thread'leri ve artifact depoları; iş kaybını önleyen mekanizmalar
  • 5. Sandbox & Compute (sandbox ve compute)

    • Her ajan için bağımsız bir çalışma alanı (sandbox) gerekli
    • İzole Unix çalışma alanları, kontrollü ağ çıkışı (egress) ve model dışında tutulan credentials; güvenlik, gizlilik ve büyük ölçekte hız sağlıyor
  • 6. Observability & Governance (gözlemlenebilirlik ve yönetişim)

    • "Göremediğin şeye güvenemezsin" — her adımın izlenmesi, her araç çağrısının log'lanması, evals'in regresyon testi olarak çalıştırılması ve en yüksek riskli kararlarda human-in-the-loop kullanımı; demoyu üretim sistemine dönüştüren şeyler
    • Guardrails politikaları zorunlu kılar, Evals ise regresyonları müşteriden önce yakalar
  • 7. Cost & Workflow Optimization (maliyet ve iş akışı optimizasyonu)

    • Yedinci bileşen, mimari yargı (architectural judgment)
    • Hangi alanların deterministik, hangilerinin deterministik olmayan biçimde ele alınacağını ayırma; adım bazında uygun modeli seçme (en ileri, orta, küçük, fine-tuned) ve bilginin beceride mi yoksa bellekte mi tutulacağına karar verme

Yeni rekabet düzeni

  • Ortaya çıkan sonuç, yazılım için yeni bir rekabet dinamiği; ancak bu her kategoriye aynı şekilde uygulanmıyor
  • Büyük laboratuvarların (başlıca yapay zeka araştırma merkezleri) öncelik verdiği pazarlar, hızlı uygulama kapasitesi ve model üzerinde doğrudan kontrol avantajından yararlanıyor
  • Ancak bunun dışındaki birbirinden ayrı binlerce pazar, startup'lara açık durumda
  • Her şirketin aynı modeli kullanabildiği bir çağda "en iyi sürenler (best riders)" kazanacak — yani asıl rekabet gücü harness tasarlama ve işletme yetkinliği

Henüz yorum yok.

Henüz yorum yok.