civStation – Civilization VI’yi strateji seviyesinde kontrol eden computer-use VLM tabanlı ajan (hatta Human in the loop ile)
(github.com/NomaDamas)-
Doğal dil komutlarıyla Civilization VI oynayan bir computer-use VLM harness
“Doğuya genişle”, “ekonomiye odaklan”, “bilim zaferi” gibi high-level intent girdileri → ajan gerçek kontrolü gerçekleştiriyor -
Strateji ile yürütmeyi ayıran 3 katmanlı yapı (Strategy / Action / HITL)
- Strategy Layer: doğal dil → yapılandırılmış hedef dönüşümü, uzun vadeli stratejiyi koruma ve görev ayrıştırma
- Action Layer: ekran tabanlı (VLM) durum algılama + fare/klavye ile yürütme (oyun API’si yok)
- HITL Layer: yürütme sırasında müdahale/düzeltme/durdurma yapılabilen controllable autonomy yapısı
-
Tek bir strateji → birden fazla action sequence’e ayrılıyor ve görev başına 2~16 model çağrısı oluşuyor
-
Alt ajan tabanlı olarak şehir yönetimi, birim hareketi gibi bounded task düzeyinde yürütme
-
Mevcut RL/IL/script yaklaşımı yerine “intent → action arayüz dönüşümü” deneyi
-
Doğrudan kontrol yerine strateji devri ve ajan orkestrasyonu yaklaşımı
-
Başlıca teknik sorunlar:
- VLM perception hataları,
- execution drift,
- başarının doğrulanmasının zorluğu
- çok adımlı yürütmede latency ve API maliyetinin artması, fallback stratejilerinin kalitesinin düşmesi
-
Tam otomasyon yerine human-in-the-loop tabanlı gerçek zamanlı strateji düzeltme ve kontrol imkanı
-
Sadece UI ortamlarında agent control / verification sorunlarını ele alan deneysel bir sistem
-
Oyun oynamanın kendisinden çok, “insan-sistem arayüzünü strateji seviyesine yükseltmeye” odaklanıyor
1 yorum
Harıl harıl fetih/kültür/bilim/diplomasi zaferine koşarken bir yerden mutlaka din zaferiyle enseye tokadı yersin