- Claude Code'u açık kaynaklı oyun RollerCoaster Tycoon 2 (OpenRCT2) ile entegre ederek yapay zekanın gerçekten lunaparkı yönetmesini sağlayan deneysel bir proje
- Yapay zeka, finans, ziyaretçi şikayetleri, oyuncak arızaları verileri dahil 100'den fazla metriği analiz ederek içecek standı kurma, personel işe alma, giriş ücretini ayarlama gibi yönetim kararlarını otomatik olarak yerine getiriyor
- Oyun içindeki tüm işlemler, CLI aracı
rctctl üzerinden komut satırından yürütülüyor ve yapı olarak Kubernetes'in kubectl aracına benzer şekilde tasarlanmış
- Claude, veri analizi, fiyat ayarlama, personel yönetimi konularında güçlü performans gösterirken, yol bağlantısı, roller coaster yerleşimi, arazi algısı gibi mekânsal görevlerde sınırlarını ortaya koydu
- Deney, ajan tasarımında temel unsurun ortamın okunabilirliği ve arayüz kalitesi olduğunu gösteriyor
Proje özeti
- Ramp Labs, Claude Code'u RollerCoaster Tycoon 2 ile entegre ederek yapay zekanın park işletmesini doğrudan yürütmesini test etti
- Claude, oyundaki finans, ziyaretçi memnuniyeti, oyuncak durumu gibi 100'den fazla veriyi analiz ediyor
- Sonuçlara göre içecek standı ekleme, bakım görevlisi işe alma, giriş ücretini artırma gibi aksiyonları otomatik öneriyor
- Deneyin amacı, B2B SaaS ortamlarında yapay zeka ajanı tasarımına dair dersler çıkarmaktı
- RollerCoaster Tycoon, müşteri odaklı iş operasyonları ve dijital geri bildirim döngülerini yansıtan bir oyun olduğu için seçildi
Neden RollerCoaster Tycoon?
- Ramp, görev bazlı küçük ajanlar geliştiriyor ve güvenlik ile bağlam sınırlamalarını dikkate alan bir yaklaşım izliyor
- Ancak ekip, geniş yetkilere sahip tek bir ajan konusunda da deneysel bir istek taşıyordu
- RollerCoaster Tycoon, ekonomi, müşteri ve operasyon yönetimini birleştiren bir ortam olarak SaaS işletimine benzer bir yapı sunuyor
- Oyunun arayüzü, B2B SaaS panolarına benziyor ve Claude'un retro-fütüristik terminal arayüzüyle de iyi örtüşüyor
Claude'un yetenekleri ve sınırları
- OpenRCT2 fork'lanarak terminal penceresi eklendi ve Claude'un oyunu komut satırından kontrol etmesi sağlandı
rctctl CLI kullanıcıların yapabileceği tüm işlemleri kapsıyor ve oyun durumu ile JSON-RPC üzerinden iletişim kuruyor
- Claude, görseller yerine ASCII harita çıktısı ile mekânsal bilgiyi kavrıyor
Claude'un güçlü yanları
- Oyun bilgisi: RCT ile ilgili bilgisi güçlü ve 90'lar oyun ortamında doğal biçimde çalışıyor
- Bilgi toplama: Ziyaretçi geri bildirimleri, finans verileri gibi çeşitli metrikleri birleştirip analiz ediyor
- Dijital işlemler: Oyuncak açma-kapama, fiyat ayarlama, personel işe alma, pazarlama yürütme gibi mekânsal olmayan işlerde güçlü
- Tesis yerleşimi: Tuvalet, içecek standı gibi basit yapıları istikrarlı şekilde yerleştirebiliyor
Claude'un zayıf yanları
- Yol bağlantısı: Yol bulma, giriş-çıkış bağlama gibi mekânsal işlerde zorlanıyor
- Roller coaster yerleşimi: Büyük oyuncaklar kurulurken engel ve araziyi algılamada başarısız oluyor
- 3 boyutlu mekân algısı: Eğim, yer altı yapıları ve özel coaster tasarımı mümkün değil
- Sonuç olarak Claude, bilgiye dayalı yönetimde güçlü; görsel ve mekânsal işlemlerde ise zayıf
Derleme süreci
- OpenRCT2 (C++) tabanı üzerine Claude terminal penceresi,
rctctl CLI, RPC katmanı ve test kodu eklendi
- İlk sürüm ChatGPT o3-Pro Deep Research ile planlandı, ardından GPT-5.1-codex ile yeniden uygulandı
- Toplamda 40 saatten fazla sürdü ve geri bildirim döngüsü eksikliği en büyük darboğaz olarak gösterildi
- QA verimliliğini artırmak için Claude'un doğrudan depo üzerinde hata raporu yazması sağlandı
Başlıca dersler
- Ortamın okunabilirliği (Environment Legibility): Claude, net veri arayüzlerinde çok başarılı ama metin tabanlı mekânsal temsilde zayıf
- Kodlama ajanlarının değeri: Son model güncellemeleri (Claude Opus 4.5 vb.) anında yansıtılabildiği için geliştirme hızı arttı
- Geliştirme döngüsünün önemi: Otomatik QA döngüsü olmadan üretkenlik keskin biçimde düşüyor
- Deneyimin üstünlüğü: LLM'lerin nasıl çalıştığını anlamanın en iyi yolu doğrudan deney yapmak ve oynamak
Çalıştırma ve açık kaynak bilgisi
- macOS (Sonoma ve üzeri), Xcode, CMake, Ninja ve RCT2 (orijinal sürüm) gerekli
rctctl CLI, kubectl tarzı komut yapısı kullanıyor ve Claude oyunu JSON-RPC üzerinden kontrol ediyor
- Derleme çıktıları:
- OpenRCT2 (yerleşik terminalli sürüm)
rctctl (CLI aracı)
- Sprite varlıkları
- Tüm kod GitHub'da (jaysobel/OpenRCT2) açık; Twitch üzerinden canlı gösterim de izlenebiliyor
Sonuç
- Claude Code, operasyon otomasyonunun potansiyelini ve sınırlarını aynı anda gösteriyor
- RollerCoaster Tycoon, grafik arayüzler ile akıllı sistemler arasındaki geçiş dönemi için bir deney alanı işlevi görüyor
- Temel içgörü: Yapay zeka ajanlarının başarısı, ortamın açıklığına ve arayüz tasarımının kalitesine bağlı
1 yorum
Hacker News görüşleri
LLM’imin kullandığı araç seviyesi çok düşük olduğu için hep hayal kırıklığı yaşıyorum
Ben IDE’de refactoring, sembol takibi, fonksiyon kullanım yerlerini görüntüleme gibi şeyleri tek tıkla yapıyorum ama LLM yalnızca grep, diff, cat gibi ilkel komutları kullanıyor
LLM’e daha iyi kod yazma ve refactoring araçları vermeye yönelik girişimler olup olmadığını merak ediyorum
Bunu AGENTS.md içinde açıkça yazsam da görmezden gelip basit yönteme dönmesi sinir bozucu
JetBrains’in elindeki refactoring ve kod inceleme yetenekleri AI ile bağlansaydı çok daha ileride olurdu gibi geliyor
Hatta LLM’ler düşük seviyeli araçları birleştirip sorun çözmede daha güçlü olabiliyor
İnsan için karmaşık olabilecek 20 satırlık bir Python scriptini LLM 0.5 saniyede üretebiliyor
Kod parçalarını hızlı anlayıp birleştirdikleri için refactoring özellikleri aksine kafa karıştırabilir
Fazla araç vermek, muhakeme kalitesini bulandırma riski taşıyor
Yazarı benim. Bonus bağlantıları paylaşıyorum
Simon Willison’ın claude-code-transcripts’ini kullanan oturum scripti
Reddit gönderisi
OpenRCT2 proje reposu
Claude, görüntü tabanlı girdilerde güçlü ama ASCII şemalarda zayıf olabilir
Gerçek dünyadaki ajan tasarımı gibi, genel amaçlı ajanların sınırları da ortamın görünürlüğü ve arayüzün gücü ile belirleniyor
Bu yüzden ajanları ‘zeka’yı değil, ‘çalışkanlık’ı otomatikleştiren varlıklar olarak görmek daha doğru
“revert” kelimesinin yanlış kullanılması yüzünden Codex’in gerçekten
git revertçalıştırıp çalışma içeriğini geri aldığı bir olay yaşanmıştıgit revertyıkıcı bir komut değil; veri kaybı yaşandıysa muhtemelengit reset --hardolmuşturjj statuskoyarsanız daha güvenli oluyorBu oyunun assembly koduyla tek bir kişi tarafından geliştirilmiş olması inanılmaz
Geliştiriciyi bulup teşekkür etmek isterim
Claude Code’un denemesi de etkileyiciydi, ilgimi çekti
Hiç C++ bilmeden vibe-coding ile projeyi tamamlamış olması ilginçti
Bugünün nesli böyle bir ortamın değerini pek bilmiyor gibi
Videonun sonundaki röportaj etkileyiciydi
kubectl tarzı CLI, Claude’un geri bildirimi, uyarı sistemi gibi AI ile insanın işbirliği araçları giderek daha önemli hâle geliyor
İnsanların görsel olarak anlayabildiği bağlamı AI’ye de verirsek çok daha iyi sonuçlar alınabilir
Sadece bağlamı artırmak öğrenme yaratmıyor; sonunda yine fine-tuning gerekiyor
Yazı ilginçti ama AI’nin oyunu gerçekte ne kadar iyi oynadığına dair sonuç analizi eksikti
2D haritayı anlamakta zorlandığı için yalnızca tuvalet ve hot dog standı gibi şeyler kurabildi
Multimodal bir model olsaydı muhtemelen çok daha iyi olurdu
Claude Code’da kalan context miktarının nasıl görüldüğünü merak etmiştim
/contextkomutuyla doğrudan görülebiliyorKalan kapasiteyi renkli çubukla görselleştiren eklentiler de var
Böyle deneyler için Civilization gibi sıra tabanlı oyunların daha uygun olduğunu düşünüyorum
Çünkü harita ızgara yapısında ve ilerleme tur bazlı