7 puan yazan ironman0722 2026-03-31 | 1 yorum | WhatsApp'ta paylaş
  • Doğal dil komutlarıyla Civilization VI oynayan bir computer-use VLM harness
    “Doğuya genişle”, “ekonomiye odaklan”, “bilim zaferi” gibi high-level intent girdileri → ajan gerçek kontrolü gerçekleştiriyor

  • Strateji ile yürütmeyi ayıran 3 katmanlı yapı (Strategy / Action / HITL)

    • Strategy Layer: doğal dil → yapılandırılmış hedef dönüşümü, uzun vadeli stratejiyi koruma ve görev ayrıştırma
    • Action Layer: ekran tabanlı (VLM) durum algılama + fare/klavye ile yürütme (oyun API’si yok)
    • HITL Layer: yürütme sırasında müdahale/düzeltme/durdurma yapılabilen controllable autonomy yapısı
  • Tek bir strateji → birden fazla action sequence’e ayrılıyor ve görev başına 2~16 model çağrısı oluşuyor

  • Alt ajan tabanlı olarak şehir yönetimi, birim hareketi gibi bounded task düzeyinde yürütme

  • Mevcut RL/IL/script yaklaşımı yerine “intent → action arayüz dönüşümü” deneyi

  • Doğrudan kontrol yerine strateji devri ve ajan orkestrasyonu yaklaşımı

  • Başlıca teknik sorunlar:

    • VLM perception hataları,
    • execution drift,
    • başarının doğrulanmasının zorluğu
    • çok adımlı yürütmede latency ve API maliyetinin artması, fallback stratejilerinin kalitesinin düşmesi
  • Tam otomasyon yerine human-in-the-loop tabanlı gerçek zamanlı strateji düzeltme ve kontrol imkanı

  • Sadece UI ortamlarında agent control / verification sorunlarını ele alan deneysel bir sistem

  • Oyun oynamanın kendisinden çok, “insan-sistem arayüzünü strateji seviyesine yükseltmeye” odaklanıyor

1 yorum

 
bus710 2026-04-01

Harıl harıl fetih/kültür/bilim/diplomasi zaferine koşarken bir yerden mutlaka din zaferiyle enseye tokadı yersin