5 puan yazan GN⁺ 2026-01-17 | 5 yorum | WhatsApp'ta paylaş
  • Cursor, ‘otonom kodlama ajanlarının haftalarca çalıştığı bir deney’ yürüttüğünü ve insan bir ekibin aylar sürecek projelerini otomatikleştirmenin ne kadar mümkün olduğunu araştırdığını duyurdu
  • Bu sistemi doğrulamak için ‘sıfırdan bir web tarayıcısı yapmak’ hedefi belirlendi ve ajanların yaklaşık bir hafta boyunca 1 milyondan fazla satır kod yazdığı iddia edildi
  • Ancak kamuya açık GitHub deposu (fastrender) çok sayıda derleme hatası ve CI başarısızlığı gösteriyor; bunun da çalışan bir tarayıcı olmadığını ortaya koyduğu görülüyor
  • Cursor, çalışıp çalışmadığını, yeniden üretilebilir bir demo ya da derlenebilen bir commit sunmadı; deney sonucunun somut olarak neden başarılı sayıldığına dair de bir kanıt yok
  • Buna rağmen Cursor, “ajanların büyük projelerde anlamlı ilerleme kaydettiğini” söyleyerek, gerçek performans doğrulaması olmadan başarılı bir izlenim bırakıyor

Cursor’un blog deneyine genel bakış

  • 14 Ocak 2026’da Cursor, Scaling long-running autonomous coding başlıklı bir blog yazısı yayımladı
    • Amaç, “insan bir ekibin aylar sürecek bir projede otonom kodlama ajanlarıyla ne kadar ileri gidilebileceğini” araştırmaktı
  • Çeşitli yaklaşımları denedikten sonra, “koordinasyon sorununu çözen ve tek bir ajana bağlı kalmadan büyük ölçekli projelere genişleyebilen” bir sisteme ulaştıklarını anlattılar
  • Doğrulama için ‘sıfırdan bir web tarayıcısı yapma’ deneyini yürüttüklerini, ajanların yaklaşık bir hafta içinde 1.000 dosya boyunca 1 milyondan fazla satır kod yazdığını açıkladılar

Deney sonuçlarındaki belirsizlik

  • Cursor, “yeni ajanların kod tabanını anlayıp anlamlı ilerleme kaydettiğini” ve “yüzlerce çalışanın aynı anda aynı branch’e push yaptığını” iddia ediyor
    • Ancak tarayıcının gerçekten çalışıp çalışmadığını açıkça belirtmiyor
  • Yazıda ekran görüntüsü videosu yer alıyor, ancak çalıştırılabilir bir demo ya da somut sonuç açıklaması bulunmuyor
  • “Sıfırdan tarayıcı yapmak çok zordur” ifadesi dışında çalıştığına dair hiçbir kanıt sunulmuyor

Kod tabanının doğrulanması sonucu

  • Depo doğrudan derlendiğinde ‘fastrender’ kütüphanesinde derleme başarısızlığı (34 hata, 94 uyarı) ortaya çıkıyor
  • Son GitHub Actions çalıştırmalarında da workflow hataları ve çok sayıda derleme başarısızlığı görülüyor
    • Son 100 commit içinde başarıyla derlenmiş tek bir commit bile yok
  • Kodun iç yapısı, niyet veya yapıdan yoksun, ‘AI slop’ düzeyinde bir çıktı olarak değerlendiriliyor
    • cargo build ya da cargo check komutlarının bile çalıştırılmadığı anlaşılıyor
    • İlgili issue #98 da hâlâ açık

Yeniden üretilebilirlik ve güvenilirlik sorunları

  • Cursor’un blogunda nasıl çalıştırılacağı, beklenen sonuçlar ve nasıl çalıştığına dair hiçbir açıklama yok
  • Yeniden üretilebilir bir demo, build talimatları ya da doğrulanmış bir commit (tag/release/commit) sunulmuyor
  • Buna rağmen yazının kurgusu ve kullanılan ifadeler, bunun “çalışan bir prototip” olduğu izlenimini veriyor
  • Cursor açıkça “çalışıyor” demediği için bu doğrudan yanlış bir beyan sayılmayabilir; ancak başarıyı ima eden bir izlenim bırakıyor

Sonuç ve değerlendirme

  • Cursor bunu “prodüksiyon seviyesinde bir tarayıcı” olarak tanımlamadı; ancak ‘anlamlı ilerleme’ ve ‘tarayıcı inşası’ gibi ifadelerle bunu başarılı bir deney gibi gösteriyor
  • Oysa ortada çalıştığına dair kanıt, derlenebilen kod veya yeniden üretilebilir sonuç yok
  • “Yüzlerce ajanın iş birliği yaparak büyük bir projede ilerleme kaydettiği” iddiası, hiçbir kanıtla desteklenmeyen bir iddia olarak kalıyor
    • En azından “derlenebilen ve basit bir HTML dosyasını render edebilen bir seviye” gibi asgari ölçütleri bile karşılamıyor
  • Sonuç olarak Cursor’un deneyi, otonom kodlamayı ölçeklendirmenin potansiyelinden çok, büyük ölçekli kod üretiminin sınırlarını gösteren bir örnek olarak öne çıkıyor

5 yorum

 
kimjoin2 2026-01-18

haha

 
sinbumu 2026-01-19

Aslında bunun başarılı şekilde gösterdiği şey, geliştiricilerin hâlâ işten çıkarılamadığı olmuş~

 
jjw9512151 2026-01-18

Başarılı sonuç = hey yönetici tayfası, demek ki bizi hâlâ kovamamışsınız

 
GN⁺ 2026-01-17
Hacker News yorumları
  • Bu haftaki deneyin sonuçta sadece Servo'nun (Rust tabanlı tarayıcı) çalışmayan bir wrapper'ı düzeyinde olduğuna dair eleştiri en üste çıkmalıydı
    İlgili yorum burada

    • Birinin popüler bir açık kaynak projeyi AI ile yeniden yazmayı deneyip denemediğini merak ediyorum
      En yeni LLM'ler lisans aklama ya da bağımlılık intihali konusunda da epey etkili olabilir gibi görünüyor. Yeni bir benchmark olarak ilginç olurdu
    • Gerçekten birinin derlemeyi başardığını söyleyen bir tweet gördüm
    • Olumsuz sonuçlar da değerlidir. Bilerek açıklanırsa saygı uyandırır, kazara ortaya çıkarsa komiktir
      Bugünün eğlencesini sağlayan Cursor'ın şerefine
    • İlk başta ekran görüntüsünü görünce kısa süreliğine işimin tehlikede olduğunu hissettim
      Ama ortada motor bile yokmuş ve tamamen bozuk durumdaymış; Cursor gerçekten utanç verici
  • Cursor'ın resmi blog yazısı oldukça temkinli bir tonda yazılmıştı ama,
    Twitter'da “GPT-5.2 ile bir tarayıcı yaptık” gibi abartılı bir izlenim verildi
    Gerçekte binlerce ajanı ayırıp haftalar boyunca commit biriktirmişler ama ortaya çıkan ürün hâlâ çalışmıyor

    • “Merge conflict çözdük” ifadesinin pek bir anlamı yok. Sadece ours ya da theirs stratejisini kullansan da her zaman çözebilirsin
    • O zaman gerçekten çalıştırmayı başaran biri oldu mu? Ekran görüntüsü nereden çıktı? Kodda fazla hata var
    • Bağlantıdaki içeriğe bakınca tarayıcı çalışmış gibi görünüyor; bunun nasıl “temkinli” sayıldığını merak ediyorum
  • Kendim doğrulamak için son 100 commit üzerinde cargo check çalıştırdım
    Sonuçların hepsi başarısız oldu. Sonuç logu'na bakabilirsiniz

    • Şimdi derlendiğini söyleyen yeni bir yorum var
    • Aslında ekran görüntüsü uydurma da olabilir. Occam'ın usturası açısından en basit açıklama bu
  • Bu tür tanıtımlar sonuçta bir fon toplama stratejisinin parçası gibi görünüyor
    Daha önce de iç modellerin ne kadar kod yazdığı gibi muğlak gönderiler paylaşmışlardı
    Bu, ortada somut bir şey olmadığı anlamına gelmiyor ama sonuçları kamuya açık paylaşmamaları hayal kırıklığı yaratıyor

    • Diğer model sağlayıcıların aksine benchmark yayımlamıyor olmaları beni hep rahatsız etmişti
      Cursor bir zamanlar çok konuşuluyordu ama şimdi terminal tabanlı ajanlar öne çıkıyor
      Bizim şirket de Cursor sözleşmesini bitirip Claude Code'a geçmeyi düşünüyor
      Muhtemelen bu tarayıcı projesi yeniden ilgi çekmek için bir girişim
    • Bu tür abartılar sonuçta sadece piyasa değerini şişirmekten ibaret. Savunulamaz
    • Bugünlerde bütün LLM şirketleri gerçekten çok 'vibe-coded' pazarlamaya dayanıyor
      GPT-5 duyurusunda da benzeri vardı. Somut ilerleme yavaşlıyor
    • Eskiden bu tür abartılardan nefret ederdim ama artık bunu dünyanın gerçeği olarak kabul etmeye başladım
      Sonuçta cevap güven değil, doğrulama
  • Cursor benzer bir deneyle bir Excel klonu da yapıyor
    GitHub deposuna göre
    160 bin workflow'un yalnızca 247'si başarılı olmuş ve çoğu bütçeyi aştığı için başarısız olmuş
    Ajanlar bu tür kısıtları hiç umursamıyor

  • En son commit artık build alıp çalışabiliyor (en azından Mac'te)
    Ama yine de hâlâ 3 milyon satırlık bir kod karmaşası
    Cursor'ın tanıtım videosundaki sayfa render edilmiyor. Muhtemelen farklı bir build kullanıldı

    • cargo check geçiyor ama git log'a bakınca bir şeyler şüpheli görünüyor
      Ajan değil, doğrudan insan eliyle yapılmış düzeltme izleri var
      Commit log analizi'ne bakın
  • Bence asıl yazı sadece tıklama çekmeye yönelik bir başlıktı
    “Binlerce AI ajanı bir tarayıcı yaptı” ifadesi fazla kışkırtıcı

    • Artık biri “AI bir tarayıcı yaptı” dediğinde bu örneğe bağlantı verebiliriz
    • Aslında çalışmayan projeler haber döngüsünde hızla dolaşıyor
      “Sahte haber” ifadesinin politik olarak kirlenmiş olması üzücü. Bu alan için tam uygun bir ifade
  • Cursor CEO'su “Rust ile rendering engine ve JS VM'i sıfırdan yaptık” diye iddia etti ama,
    gerçek bağımlılık listesine bakınca
    html5ever, cssparser, rquickjs gibi Servo tabanlı kütüphaneleri aynen kullandıkları görülüyor
    Sonuçta yaptıkları şey Servo'yu sarmalamaktan ibaret ve derlenmiyor bile

    • Neden özellikle CSS ve JS'yi kendileri uygulamış gibi iddia ettiklerini anlamıyorum
      Çoğu insan koda bakınca bunu hemen anlayabilir ama herhâlde genel kitlenin kontrol etmeyeceğini düşündüler
      Bu şekilde yanlış algılar yayılıyor ve sonra düzeltilse bile kimse önemsemiyor
    • Gerçekte Servo'nun HTML/CSS parser'ları, QuickJS, resvg, egui, wgpu vb. ile kurulmuş
      Bunun 3 milyon satır olması komik
    • selectors ve taffy de var ve bazılarında eski sürüm bağımlılıkları kullanılıyor
    • JS motoru sadece kişisel bir projenin vendor klasörüne kopyalanmış hâli
      İlgili detaylar için buraya bakın
    • Layout kodunun Servo'dan mı alındığını, yoksa Cursor'ın kendisinin mi yazdığını merak ediyorum
      Burası tarayıcıdaki en zor alan
  • Bu pazarlama yaklaşımının ters teptiğini düşünüyorum
    Cursor'ın tasarımı ve UX'i harika ama derinlikli işlerde hata sayısı çok fazla
    Claude modelleri eklendikten sonra biraz iyileşti ama hâlâ Antigravity'den kötü
    Üstelik $20'lık abonelik limiti de çok çabuk tükeniyor. Modellerin 10 kat daha iyi ve 10 kat daha ucuz olması pek olası görünmüyor

    • Çeşitli AI şirketlerinin bug dolu uygulamalarını kullanırken, gerçek iş için hâlâ insan becerisine ihtiyaç olduğunu hissediyorum
      OpenAI'ın iş modelinin reklama kaydığını görünce,
      Google'ın bu teknolojiyi daha gerçekçi anladığını düşünmeye başlıyorum
  • Bu tür hikâyeler sonuçta 'kazma satanlar' için
    Konuyu pek bilmeyen CEO'lar bu tür haberlere kanıp gerçekten insanları işten çıkarabilir