16 puan yazan GN⁺ 2026-01-19 | 1 yorum | WhatsApp'ta paylaş
  • Claude Code'u açık kaynaklı oyun RollerCoaster Tycoon 2 (OpenRCT2) ile entegre ederek yapay zekanın gerçekten lunaparkı yönetmesini sağlayan deneysel bir proje
  • Yapay zeka, finans, ziyaretçi şikayetleri, oyuncak arızaları verileri dahil 100'den fazla metriği analiz ederek içecek standı kurma, personel işe alma, giriş ücretini ayarlama gibi yönetim kararlarını otomatik olarak yerine getiriyor
  • Oyun içindeki tüm işlemler, CLI aracı rctctl üzerinden komut satırından yürütülüyor ve yapı olarak Kubernetes'in kubectl aracına benzer şekilde tasarlanmış
  • Claude, veri analizi, fiyat ayarlama, personel yönetimi konularında güçlü performans gösterirken, yol bağlantısı, roller coaster yerleşimi, arazi algısı gibi mekânsal görevlerde sınırlarını ortaya koydu
  • Deney, ajan tasarımında temel unsurun ortamın okunabilirliği ve arayüz kalitesi olduğunu gösteriyor

Proje özeti

  • Ramp Labs, Claude Code'u RollerCoaster Tycoon 2 ile entegre ederek yapay zekanın park işletmesini doğrudan yürütmesini test etti
    • Claude, oyundaki finans, ziyaretçi memnuniyeti, oyuncak durumu gibi 100'den fazla veriyi analiz ediyor
    • Sonuçlara göre içecek standı ekleme, bakım görevlisi işe alma, giriş ücretini artırma gibi aksiyonları otomatik öneriyor
  • Deneyin amacı, B2B SaaS ortamlarında yapay zeka ajanı tasarımına dair dersler çıkarmaktı
  • RollerCoaster Tycoon, müşteri odaklı iş operasyonları ve dijital geri bildirim döngülerini yansıtan bir oyun olduğu için seçildi

Neden RollerCoaster Tycoon?

  • Ramp, görev bazlı küçük ajanlar geliştiriyor ve güvenlik ile bağlam sınırlamalarını dikkate alan bir yaklaşım izliyor
  • Ancak ekip, geniş yetkilere sahip tek bir ajan konusunda da deneysel bir istek taşıyordu
  • RollerCoaster Tycoon, ekonomi, müşteri ve operasyon yönetimini birleştiren bir ortam olarak SaaS işletimine benzer bir yapı sunuyor
  • Oyunun arayüzü, B2B SaaS panolarına benziyor ve Claude'un retro-fütüristik terminal arayüzüyle de iyi örtüşüyor

Claude'un yetenekleri ve sınırları

  • OpenRCT2 fork'lanarak terminal penceresi eklendi ve Claude'un oyunu komut satırından kontrol etmesi sağlandı
  • rctctl CLI kullanıcıların yapabileceği tüm işlemleri kapsıyor ve oyun durumu ile JSON-RPC üzerinden iletişim kuruyor
  • Claude, görseller yerine ASCII harita çıktısı ile mekânsal bilgiyi kavrıyor

Claude'un güçlü yanları

  • Oyun bilgisi: RCT ile ilgili bilgisi güçlü ve 90'lar oyun ortamında doğal biçimde çalışıyor
  • Bilgi toplama: Ziyaretçi geri bildirimleri, finans verileri gibi çeşitli metrikleri birleştirip analiz ediyor
  • Dijital işlemler: Oyuncak açma-kapama, fiyat ayarlama, personel işe alma, pazarlama yürütme gibi mekânsal olmayan işlerde güçlü
  • Tesis yerleşimi: Tuvalet, içecek standı gibi basit yapıları istikrarlı şekilde yerleştirebiliyor

Claude'un zayıf yanları

  • Yol bağlantısı: Yol bulma, giriş-çıkış bağlama gibi mekânsal işlerde zorlanıyor
  • Roller coaster yerleşimi: Büyük oyuncaklar kurulurken engel ve araziyi algılamada başarısız oluyor
  • 3 boyutlu mekân algısı: Eğim, yer altı yapıları ve özel coaster tasarımı mümkün değil
  • Sonuç olarak Claude, bilgiye dayalı yönetimde güçlü; görsel ve mekânsal işlemlerde ise zayıf

Derleme süreci

  • OpenRCT2 (C++) tabanı üzerine Claude terminal penceresi, rctctl CLI, RPC katmanı ve test kodu eklendi
  • İlk sürüm ChatGPT o3-Pro Deep Research ile planlandı, ardından GPT-5.1-codex ile yeniden uygulandı
  • Toplamda 40 saatten fazla sürdü ve geri bildirim döngüsü eksikliği en büyük darboğaz olarak gösterildi
  • QA verimliliğini artırmak için Claude'un doğrudan depo üzerinde hata raporu yazması sağlandı

Başlıca dersler

  • Ortamın okunabilirliği (Environment Legibility): Claude, net veri arayüzlerinde çok başarılı ama metin tabanlı mekânsal temsilde zayıf
  • Kodlama ajanlarının değeri: Son model güncellemeleri (Claude Opus 4.5 vb.) anında yansıtılabildiği için geliştirme hızı arttı
  • Geliştirme döngüsünün önemi: Otomatik QA döngüsü olmadan üretkenlik keskin biçimde düşüyor
  • Deneyimin üstünlüğü: LLM'lerin nasıl çalıştığını anlamanın en iyi yolu doğrudan deney yapmak ve oynamak

Çalıştırma ve açık kaynak bilgisi

  • macOS (Sonoma ve üzeri), Xcode, CMake, Ninja ve RCT2 (orijinal sürüm) gerekli
  • rctctl CLI, kubectl tarzı komut yapısı kullanıyor ve Claude oyunu JSON-RPC üzerinden kontrol ediyor
  • Derleme çıktıları:
    • OpenRCT2 (yerleşik terminalli sürüm)
    • rctctl (CLI aracı)
    • Sprite varlıkları
  • Tüm kod GitHub'da (jaysobel/OpenRCT2) açık; Twitch üzerinden canlı gösterim de izlenebiliyor

Sonuç

  • Claude Code, operasyon otomasyonunun potansiyelini ve sınırlarını aynı anda gösteriyor
  • RollerCoaster Tycoon, grafik arayüzler ile akıllı sistemler arasındaki geçiş dönemi için bir deney alanı işlevi görüyor
  • Temel içgörü: Yapay zeka ajanlarının başarısı, ortamın açıklığına ve arayüz tasarımının kalitesine bağlı

1 yorum

 
GN⁺ 2026-01-19
Hacker News görüşleri
  • LLM’imin kullandığı araç seviyesi çok düşük olduğu için hep hayal kırıklığı yaşıyorum
    Ben IDE’de refactoring, sembol takibi, fonksiyon kullanım yerlerini görüntüleme gibi şeyleri tek tıkla yapıyorum ama LLM yalnızca grep, diff, cat gibi ilkel komutları kullanıyor
    LLM’e daha iyi kod yazma ve refactoring araçları vermeye yönelik girişimler olup olmadığını merak ediyorum

    • VSCode Diagnostics ya da LSP sunucusuna erişim izni verseniz bile, LLM yine hep temel CLI araçlarını kullanmaya çalışıyor
      Bunu AGENTS.md içinde açıkça yazsam da görmezden gelip basit yönteme dönmesi sinir bozucu
    • AI geliştirme araçlarının çoğunun VSCode tabanlı olması şaşırtıcı
      JetBrains’in elindeki refactoring ve kod inceleme yetenekleri AI ile bağlansaydı çok daha ileride olurdu gibi geliyor
    • Claude Code, 2025 Aralık sürümünde LSP’yi resmi olarak desteklemeye başladı ama yine de sanki hâlâ basit araç merkezli eğitilmiş gibi
      Hatta LLM’ler düşük seviyeli araçları birleştirip sorun çözmede daha güçlü olabiliyor
      İnsan için karmaşık olabilecek 20 satırlık bir Python scriptini LLM 0.5 saniyede üretebiliyor
    • Zed Editor, LSP tabanlı özellikleri LLM’e doğrudan vererek grep bağımlılığını azaltıyor
    • LLM’lerin insanlar gibi IDE özelliklerine mutlaka ihtiyacı yok
      Kod parçalarını hızlı anlayıp birleştirdikleri için refactoring özellikleri aksine kafa karıştırabilir
      Fazla araç vermek, muhakeme kalitesini bulandırma riski taşıyor
  • Yazarı benim. Bonus bağlantıları paylaşıyorum
    Simon Willison’ın claude-code-transcripts’ini kullanan oturum scripti
    Reddit gönderisi
    OpenRCT2 proje reposu

    • Değerlendirmeyi CLI yerine ekran görüntüleri ya da görselleştirilmiş ekranlar üzerinden yapıp yapmadığını merak ediyorum
      Claude, görüntü tabanlı girdilerde güçlü ama ASCII şemalarda zayıf olabilir
    • Claude’un görsel ve uzamsal algı sınırlarından söz edilerek, OpenAI modellerinin görüntü anlamada daha iyi olabileceği görüşü var
  • Gerçek dünyadaki ajan tasarımı gibi, genel amaçlı ajanların sınırları da ortamın görünürlüğü ve arayüzün gücü ile belirleniyor
    Bu yüzden ajanları ‘zeka’yı değil, ‘çalışkanlık’ı otomatikleştiren varlıklar olarak görmek daha doğru

  • “revert” kelimesinin yanlış kullanılması yüzünden Codex’in gerçekten git revert çalıştırıp çalışma içeriğini geri aldığı bir olay yaşanmıştı

    • Bu araçların işlem günlüklerini yeniden oynatılabilir biçimde saklamaması şaşırtıcı
      git revert yıkıcı bir komut değil; veri kaybı yaşandıysa muhtemelen git reset --hard olmuştur
    • Bu tür kazaları önlemek için komut yetkisi kontrolü özelliği gerekiyor
    • Bu yüzden Jujutsu kullanalım diyenler de var; prompt içine jj status koyarsanız daha güvenli oluyor
  • Bu oyunun assembly koduyla tek bir kişi tarafından geliştirilmiş olması inanılmaz
    Geliştiriciyi bulup teşekkür etmek isterim
    Claude Code’un denemesi de etkileyiciydi, ilgimi çekti

  • Hiç C++ bilmeden vibe-coding ile projeyi tamamlamış olması ilginçti

    • Genelde vibe-coding hikâyeleri “birkaç saatte bitirdim” der ama bu kez gerçekçi bir takvim sunulması ferahlatıcıydı
    • Deneme-yanılmaları ve sorun çözme süreci gerçekten çok ilgi çekiciydi
    • 1997’de böyle bir şey olsaydı, tüm birikimimi verip alırdım herhalde
      Bugünün nesli böyle bir ortamın değerini pek bilmiyor gibi
  • Videonun sonundaki röportaj etkileyiciydi
    kubectl tarzı CLI, Claude’un geri bildirimi, uyarı sistemi gibi AI ile insanın işbirliği araçları giderek daha önemli hâle geliyor
    İnsanların görsel olarak anlayabildiği bağlamı AI’ye de verirsek çok daha iyi sonuçlar alınabilir

    • Ama AI’nin kendini geliştirdiği yapı pratikte pek çalışmıyor
      Sadece bağlamı artırmak öğrenme yaratmıyor; sonunda yine fine-tuning gerekiyor
  • Yazı ilginçti ama AI’nin oyunu gerçekte ne kadar iyi oynadığına dair sonuç analizi eksikti

    • Aslında finans yönetiminde iyiydi ama bina inşa etmede zayıftı
      2D haritayı anlamakta zorlandığı için yalnızca tuvalet ve hot dog standı gibi şeyler kurabildi
      Multimodal bir model olsaydı muhtemelen çok daha iyi olurdu
    • Bazıları AI’nin özünün doğrulama değil üretim kabiliyeti olduğunu düşünüyor
  • Claude Code’da kalan context miktarının nasıl görüldüğünü merak etmiştim

    • /context komutuyla doğrudan görülebiliyor
    • Status line’a context kullanım göstergesi de eklenebiliyor
      Kalan kapasiteyi renkli çubukla görselleştiren eklentiler de var
  • Böyle deneyler için Civilization gibi sıra tabanlı oyunların daha uygun olduğunu düşünüyorum
    Çünkü harita ızgara yapısında ve ilerleme tur bazlı