- Cursor, ‘otonom kodlama ajanlarının haftalarca çalıştığı bir deney’ yürüttüğünü ve insan bir ekibin aylar sürecek projelerini otomatikleştirmenin ne kadar mümkün olduğunu araştırdığını duyurdu
- Bu sistemi doğrulamak için ‘sıfırdan bir web tarayıcısı yapmak’ hedefi belirlendi ve ajanların yaklaşık bir hafta boyunca 1 milyondan fazla satır kod yazdığı iddia edildi
- Ancak kamuya açık GitHub deposu (fastrender) çok sayıda derleme hatası ve CI başarısızlığı gösteriyor; bunun da çalışan bir tarayıcı olmadığını ortaya koyduğu görülüyor
- Cursor, çalışıp çalışmadığını, yeniden üretilebilir bir demo ya da derlenebilen bir commit sunmadı; deney sonucunun somut olarak neden başarılı sayıldığına dair de bir kanıt yok
- Buna rağmen Cursor, “ajanların büyük projelerde anlamlı ilerleme kaydettiğini” söyleyerek, gerçek performans doğrulaması olmadan başarılı bir izlenim bırakıyor
Cursor’un blog deneyine genel bakış
- 14 Ocak 2026’da Cursor, “Scaling long-running autonomous coding” başlıklı bir blog yazısı yayımladı
- Amaç, “insan bir ekibin aylar sürecek bir projede otonom kodlama ajanlarıyla ne kadar ileri gidilebileceğini” araştırmaktı
- Çeşitli yaklaşımları denedikten sonra, “koordinasyon sorununu çözen ve tek bir ajana bağlı kalmadan büyük ölçekli projelere genişleyebilen” bir sisteme ulaştıklarını anlattılar
- Doğrulama için ‘sıfırdan bir web tarayıcısı yapma’ deneyini yürüttüklerini, ajanların yaklaşık bir hafta içinde 1.000 dosya boyunca 1 milyondan fazla satır kod yazdığını açıkladılar
Deney sonuçlarındaki belirsizlik
- Cursor, “yeni ajanların kod tabanını anlayıp anlamlı ilerleme kaydettiğini” ve “yüzlerce çalışanın aynı anda aynı branch’e push yaptığını” iddia ediyor
- Ancak tarayıcının gerçekten çalışıp çalışmadığını açıkça belirtmiyor
- Yazıda ekran görüntüsü videosu yer alıyor, ancak çalıştırılabilir bir demo ya da somut sonuç açıklaması bulunmuyor
- “Sıfırdan tarayıcı yapmak çok zordur” ifadesi dışında çalıştığına dair hiçbir kanıt sunulmuyor
Kod tabanının doğrulanması sonucu
- Depo doğrudan derlendiğinde ‘fastrender’ kütüphanesinde derleme başarısızlığı (34 hata, 94 uyarı) ortaya çıkıyor
- Son GitHub Actions çalıştırmalarında da workflow hataları ve çok sayıda derleme başarısızlığı görülüyor
- Son 100 commit içinde başarıyla derlenmiş tek bir commit bile yok
- Kodun iç yapısı, niyet veya yapıdan yoksun, ‘AI slop’ düzeyinde bir çıktı olarak değerlendiriliyor
cargo build ya da cargo check komutlarının bile çalıştırılmadığı anlaşılıyor
- İlgili issue #98 da hâlâ açık
Yeniden üretilebilirlik ve güvenilirlik sorunları
- Cursor’un blogunda nasıl çalıştırılacağı, beklenen sonuçlar ve nasıl çalıştığına dair hiçbir açıklama yok
- Yeniden üretilebilir bir demo, build talimatları ya da doğrulanmış bir commit (tag/release/commit) sunulmuyor
- Buna rağmen yazının kurgusu ve kullanılan ifadeler, bunun “çalışan bir prototip” olduğu izlenimini veriyor
- Cursor açıkça “çalışıyor” demediği için bu doğrudan yanlış bir beyan sayılmayabilir; ancak başarıyı ima eden bir izlenim bırakıyor
Sonuç ve değerlendirme
- Cursor bunu “prodüksiyon seviyesinde bir tarayıcı” olarak tanımlamadı; ancak ‘anlamlı ilerleme’ ve ‘tarayıcı inşası’ gibi ifadelerle bunu başarılı bir deney gibi gösteriyor
- Oysa ortada çalıştığına dair kanıt, derlenebilen kod veya yeniden üretilebilir sonuç yok
- “Yüzlerce ajanın iş birliği yaparak büyük bir projede ilerleme kaydettiği” iddiası, hiçbir kanıtla desteklenmeyen bir iddia olarak kalıyor
- En azından “derlenebilen ve basit bir HTML dosyasını render edebilen bir seviye” gibi asgari ölçütleri bile karşılamıyor
- Sonuç olarak Cursor’un deneyi, otonom kodlamayı ölçeklendirmenin potansiyelinden çok, büyük ölçekli kod üretiminin sınırlarını gösteren bir örnek olarak öne çıkıyor
5 yorum
haha
İlgili yazı - 장시간 실행되는 자율 코딩의 확장
Aslında bunun başarılı şekilde gösterdiği şey, geliştiricilerin hâlâ işten çıkarılamadığı olmuş~
Başarılı sonuç = hey yönetici tayfası, demek ki bizi hâlâ kovamamışsınız
Hacker News yorumları
Bu haftaki deneyin sonuçta sadece Servo'nun (Rust tabanlı tarayıcı) çalışmayan bir wrapper'ı düzeyinde olduğuna dair eleştiri en üste çıkmalıydı
İlgili yorum burada
En yeni LLM'ler lisans aklama ya da bağımlılık intihali konusunda da epey etkili olabilir gibi görünüyor. Yeni bir benchmark olarak ilginç olurdu
Bugünün eğlencesini sağlayan Cursor'ın şerefine
Ama ortada motor bile yokmuş ve tamamen bozuk durumdaymış; Cursor gerçekten utanç verici
Cursor'ın resmi blog yazısı oldukça temkinli bir tonda yazılmıştı ama,
Twitter'da “GPT-5.2 ile bir tarayıcı yaptık” gibi abartılı bir izlenim verildi
Gerçekte binlerce ajanı ayırıp haftalar boyunca commit biriktirmişler ama ortaya çıkan ürün hâlâ çalışmıyor
oursya datheirsstratejisini kullansan da her zaman çözebilirsinKendim doğrulamak için son 100 commit üzerinde
cargo checkçalıştırdımSonuçların hepsi başarısız oldu. Sonuç logu'na bakabilirsiniz
Bu tür tanıtımlar sonuçta bir fon toplama stratejisinin parçası gibi görünüyor
Daha önce de iç modellerin ne kadar kod yazdığı gibi muğlak gönderiler paylaşmışlardı
Bu, ortada somut bir şey olmadığı anlamına gelmiyor ama sonuçları kamuya açık paylaşmamaları hayal kırıklığı yaratıyor
Cursor bir zamanlar çok konuşuluyordu ama şimdi terminal tabanlı ajanlar öne çıkıyor
Bizim şirket de Cursor sözleşmesini bitirip Claude Code'a geçmeyi düşünüyor
Muhtemelen bu tarayıcı projesi yeniden ilgi çekmek için bir girişim
GPT-5 duyurusunda da benzeri vardı. Somut ilerleme yavaşlıyor
Sonuçta cevap güven değil, doğrulama
Cursor benzer bir deneyle bir Excel klonu da yapıyor
GitHub deposuna göre
160 bin workflow'un yalnızca 247'si başarılı olmuş ve çoğu bütçeyi aştığı için başarısız olmuş
Ajanlar bu tür kısıtları hiç umursamıyor
En son commit artık build alıp çalışabiliyor (en azından Mac'te)
Ama yine de hâlâ 3 milyon satırlık bir kod karmaşası
Cursor'ın tanıtım videosundaki sayfa render edilmiyor. Muhtemelen farklı bir build kullanıldı
cargo checkgeçiyor amagit log'a bakınca bir şeyler şüpheli görünüyorAjan değil, doğrudan insan eliyle yapılmış düzeltme izleri var
Commit log analizi'ne bakın
Bence asıl yazı sadece tıklama çekmeye yönelik bir başlıktı
“Binlerce AI ajanı bir tarayıcı yaptı” ifadesi fazla kışkırtıcı
“Sahte haber” ifadesinin politik olarak kirlenmiş olması üzücü. Bu alan için tam uygun bir ifade
Cursor CEO'su “Rust ile rendering engine ve JS VM'i sıfırdan yaptık” diye iddia etti ama,
gerçek bağımlılık listesine bakınca
html5ever, cssparser, rquickjs gibi Servo tabanlı kütüphaneleri aynen kullandıkları görülüyor
Sonuçta yaptıkları şey Servo'yu sarmalamaktan ibaret ve derlenmiyor bile
Çoğu insan koda bakınca bunu hemen anlayabilir ama herhâlde genel kitlenin kontrol etmeyeceğini düşündüler
Bu şekilde yanlış algılar yayılıyor ve sonra düzeltilse bile kimse önemsemiyor
Bunun 3 milyon satır olması komik
İlgili detaylar için buraya bakın
Burası tarayıcıdaki en zor alan
Bu pazarlama yaklaşımının ters teptiğini düşünüyorum
Cursor'ın tasarımı ve UX'i harika ama derinlikli işlerde hata sayısı çok fazla
Claude modelleri eklendikten sonra biraz iyileşti ama hâlâ Antigravity'den kötü
Üstelik $20'lık abonelik limiti de çok çabuk tükeniyor. Modellerin 10 kat daha iyi ve 10 kat daha ucuz olması pek olası görünmüyor
OpenAI'ın iş modelinin reklama kaydığını görünce,
Google'ın bu teknolojiyi daha gerçekçi anladığını düşünmeye başlıyorum
Bu tür hikâyeler sonuçta 'kazma satanlar' için
Konuyu pek bilmeyen CEO'lar bu tür haberlere kanıp gerçekten insanları işten çıkarabilir