civStation – Civilization VI’yi strateji seviyesinde kontrol eden computer-use VLM tabanlı ajan (hatta Human in the loop ile)

ironman0722 · 2026-03-31T14:03:37+09:00

Doğal dil komutlarıyla Civilization VI oynayan bir computer-use VLM harness “Doğuya genişle”, “ekonomiye odaklan”, “bilim zaferi” gibi high-level intent girdileri → ajan gerçek kontrolü gerçekleştiriyor Strateji ile yürütmeyi ayıran 3 katmanlı yapı (Strategy / Action / HITL) Strategy Layer: doğal dil → yapılandırılmış hedef dönüşümü, uzun vadeli stratejiyi koruma ve görev ayrıştırma Action Layer: ekran tabanlı (VLM) durum algılama + fare/klavye ile yürütme (oyun API’si yok) HITL Layer: yürütme sırasında müdahale/düzeltme/durdurma yapılabilen controllable autonomy yapısı Tek bir strateji → birden fazla action sequence’e ayrılıyor ve görev başına 2~16 model çağrısı oluşuyor Alt ajan tabanlı olarak şehir yönetimi, birim hareketi gibi bounded task düzeyinde yürütme Mevcut RL/IL/script yaklaşımı yerine “intent → action arayüz dönüşümü” deneyi Doğrudan kontrol yerine strateji devri ve ajan orkestrasyonu yaklaşımı Başlıca teknik sorunlar: VLM perception hataları, execution drift, başarının doğrulanmasının zorluğu çok adımlı yürütmede latency ve API maliyetinin artması, fallback stratejilerinin kalitesinin düşmesi Tam otomasyon yerine human-in-the-loop tabanlı gerçek zamanlı strateji düzeltme ve kontrol imkanı Sadece UI ortamlarında agent control / verification sorunlarını ele alan deneysel bir sistem Oyun oynamanın kendisinden çok, “insan-sistem arayüzünü strateji seviyesine yükseltmeye” odaklanıyor

(github.com/NomaDamas)

7 puan yazan ironman0722 2026-03-31 | 1 yorum | WhatsApp'ta paylaş

Doğal dil komutlarıyla Civilization VI oynayan bir computer-use VLM harness
“Doğuya genişle”, “ekonomiye odaklan”, “bilim zaferi” gibi high-level intent girdileri → ajan gerçek kontrolü gerçekleştiriyor
Strateji ile yürütmeyi ayıran 3 katmanlı yapı (Strategy / Action / HITL)
- Strategy Layer: doğal dil → yapılandırılmış hedef dönüşümü, uzun vadeli stratejiyi koruma ve görev ayrıştırma
- Action Layer: ekran tabanlı (VLM) durum algılama + fare/klavye ile yürütme (oyun API’si yok)
- HITL Layer: yürütme sırasında müdahale/düzeltme/durdurma yapılabilen controllable autonomy yapısı
Tek bir strateji → birden fazla action sequence’e ayrılıyor ve görev başına 2~16 model çağrısı oluşuyor
Reklam
Alt ajan tabanlı olarak şehir yönetimi, birim hareketi gibi bounded task düzeyinde yürütme
Mevcut RL/IL/script yaklaşımı yerine “intent → action arayüz dönüşümü” deneyi
Doğrudan kontrol yerine strateji devri ve ajan orkestrasyonu yaklaşımı
Başlıca teknik sorunlar:
- VLM perception hataları,
- execution drift,
- başarının doğrulanmasının zorluğu
- çok adımlı yürütmede latency ve API maliyetinin artması, fallback stratejilerinin kalitesinin düşmesi
Reklam
Tam otomasyon yerine human-in-the-loop tabanlı gerçek zamanlı strateji düzeltme ve kontrol imkanı
Sadece UI ortamlarında agent control / verification sorunlarını ele alan deneysel bir sistem
Oyun oynamanın kendisinden çok, “insan-sistem arayüzünü strateji seviyesine yükseltmeye” odaklanıyor

1 yorum

bus710 2026-04-01

Harıl harıl fetih/kültür/bilim/diplomasi zaferine koşarken bir yerden mutlaka din zaferiyle enseye tokadı yersin

civStation – Civilization VI’yi strateji seviyesinde kontrol eden computer-use VLM tabanlı ajan (hatta Human in the loop ile)

İlgili okumalar

1 yorum