Cursor’un son ‘tarayıcı deneyi’, kanıt sunmadan başarı ima ediyor

(embedding-shapes.github.io)

5 puan yazan GN⁺ 2026-01-17 | 5 yorum | WhatsApp'ta paylaş

Cursor, ‘otonom kodlama ajanlarının haftalarca çalıştığı bir deney’ yürüttüğünü ve insan bir ekibin aylar sürecek projelerini otomatikleştirmenin ne kadar mümkün olduğunu araştırdığını duyurdu
Bu sistemi doğrulamak için ‘sıfırdan bir web tarayıcısı yapmak’ hedefi belirlendi ve ajanların yaklaşık bir hafta boyunca 1 milyondan fazla satır kod yazdığı iddia edildi
Ancak kamuya açık GitHub deposu (fastrender) çok sayıda derleme hatası ve CI başarısızlığı gösteriyor; bunun da çalışan bir tarayıcı olmadığını ortaya koyduğu görülüyor
Cursor, çalışıp çalışmadığını, yeniden üretilebilir bir demo ya da derlenebilen bir commit sunmadı; deney sonucunun somut olarak neden başarılı sayıldığına dair de bir kanıt yok
Buna rağmen Cursor, “ajanların büyük projelerde anlamlı ilerleme kaydettiğini” söyleyerek, gerçek performans doğrulaması olmadan başarılı bir izlenim bırakıyor

Cursor’un blog deneyine genel bakış

14 Ocak 2026’da Cursor, “Scaling long-running autonomous coding” başlıklı bir blog yazısı yayımladı
- Amaç, “insan bir ekibin aylar sürecek bir projede otonom kodlama ajanlarıyla ne kadar ileri gidilebileceğini” araştırmaktı
Çeşitli yaklaşımları denedikten sonra, “koordinasyon sorununu çözen ve tek bir ajana bağlı kalmadan büyük ölçekli projelere genişleyebilen” bir sisteme ulaştıklarını anlattılar
Doğrulama için ‘sıfırdan bir web tarayıcısı yapma’ deneyini yürüttüklerini, ajanların yaklaşık bir hafta içinde 1.000 dosya boyunca 1 milyondan fazla satır kod yazdığını açıkladılar
- Kaynak kodu GitHub deposu wilsonzlin/fastrender üzerinden paylaşıldı

Deney sonuçlarındaki belirsizlik

Cursor, “yeni ajanların kod tabanını anlayıp anlamlı ilerleme kaydettiğini” ve “yüzlerce çalışanın aynı anda aynı branch’e push yaptığını” iddia ediyor
- Ancak tarayıcının gerçekten çalışıp çalışmadığını açıkça belirtmiyor
Yazıda ekran görüntüsü videosu yer alıyor, ancak çalıştırılabilir bir demo ya da somut sonuç açıklaması bulunmuyor
“Sıfırdan tarayıcı yapmak çok zordur” ifadesi dışında çalıştığına dair hiçbir kanıt sunulmuyor

Kod tabanının doğrulanması sonucu

Depo doğrudan derlendiğinde ‘fastrender’ kütüphanesinde derleme başarısızlığı (34 hata, 94 uyarı) ortaya çıkıyor
Son GitHub Actions çalıştırmalarında da workflow hataları ve çok sayıda derleme başarısızlığı görülüyor
- Son 100 commit içinde başarıyla derlenmiş tek bir commit bile yok
Kodun iç yapısı, niyet veya yapıdan yoksun, ‘AI slop’ düzeyinde bir çıktı olarak değerlendiriliyor
- cargo build ya da cargo check komutlarının bile çalıştırılmadığı anlaşılıyor
- İlgili issue #98 da hâlâ açık
Reklam

Yeniden üretilebilirlik ve güvenilirlik sorunları

Cursor’un blogunda nasıl çalıştırılacağı, beklenen sonuçlar ve nasıl çalıştığına dair hiçbir açıklama yok
Yeniden üretilebilir bir demo, build talimatları ya da doğrulanmış bir commit (tag/release/commit) sunulmuyor
Buna rağmen yazının kurgusu ve kullanılan ifadeler, bunun “çalışan bir prototip” olduğu izlenimini veriyor
Cursor açıkça “çalışıyor” demediği için bu doğrudan yanlış bir beyan sayılmayabilir; ancak başarıyı ima eden bir izlenim bırakıyor

Sonuç ve değerlendirme

Cursor bunu “prodüksiyon seviyesinde bir tarayıcı” olarak tanımlamadı; ancak ‘anlamlı ilerleme’ ve ‘tarayıcı inşası’ gibi ifadelerle bunu başarılı bir deney gibi gösteriyor
Oysa ortada çalıştığına dair kanıt, derlenebilen kod veya yeniden üretilebilir sonuç yok
“Yüzlerce ajanın iş birliği yaparak büyük bir projede ilerleme kaydettiği” iddiası, hiçbir kanıtla desteklenmeyen bir iddia olarak kalıyor
- En azından “derlenebilen ve basit bir HTML dosyasını render edebilen bir seviye” gibi asgari ölçütleri bile karşılamıyor
Sonuç olarak Cursor’un deneyi, otonom kodlamayı ölçeklendirmenin potansiyelinden çok, büyük ölçekli kod üretiminin sınırlarını gösteren bir örnek olarak öne çıkıyor

5 yorum

sinbumu 2026-01-19

Aslında bunun başarılı şekilde gösterdiği şey, geliştiricilerin hâlâ işten çıkarılamadığı olmuş~

jjw9512151 2026-01-18

Başarılı sonuç = hey yönetici tayfası, demek ki bizi hâlâ kovamamışsınız

kimjoin2 2026-01-18

haha

laeyoung 2026-01-17

İlgili yazı - 장시간 실행되는 자율 코딩의 확장

GN⁺ 2026-01-17

Hacker News yorumları

Bu haftaki deneyin sonuçta sadece Servo'nun (Rust tabanlı tarayıcı) çalışmayan bir wrapper'ı düzeyinde olduğuna dair eleştiri en üste çıkmalıydı
İlgili yorum burada
- Birinin popüler bir açık kaynak projeyi AI ile yeniden yazmayı deneyip denemediğini merak ediyorum
  En yeni LLM'ler lisans aklama ya da bağımlılık intihali konusunda da epey etkili olabilir gibi görünüyor. Yeni bir benchmark olarak ilginç olurdu
- Gerçekten birinin derlemeyi başardığını söyleyen bir tweet gördüm
- Olumsuz sonuçlar da değerlidir. Bilerek açıklanırsa saygı uyandırır, kazara ortaya çıkarsa komiktir
  Bugünün eğlencesini sağlayan Cursor'ın şerefine
- İlk başta ekran görüntüsünü görünce kısa süreliğine işimin tehlikede olduğunu hissettim
  Ama ortada motor bile yokmuş ve tamamen bozuk durumdaymış; Cursor gerçekten utanç verici
Cursor'ın resmi blog yazısı oldukça temkinli bir tonda yazılmıştı ama,
Twitter'da “GPT-5.2 ile bir tarayıcı yaptık” gibi abartılı bir izlenim verildi
Gerçekte binlerce ajanı ayırıp haftalar boyunca commit biriktirmişler ama ortaya çıkan ürün hâlâ çalışmıyor
- “Merge conflict çözdük” ifadesinin pek bir anlamı yok. Sadece ours ya da theirs stratejisini kullansan da her zaman çözebilirsin
- O zaman gerçekten çalıştırmayı başaran biri oldu mu? Ekran görüntüsü nereden çıktı? Kodda fazla hata var
- Bağlantıdaki içeriğe bakınca tarayıcı çalışmış gibi görünüyor; bunun nasıl “temkinli” sayıldığını merak ediyorum
Kendim doğrulamak için son 100 commit üzerinde cargo check çalıştırdım
Sonuçların hepsi başarısız oldu. Sonuç logu'na bakabilirsiniz
- Şimdi derlendiğini söyleyen yeni bir yorum var
- Aslında ekran görüntüsü uydurma da olabilir. Occam'ın usturası açısından en basit açıklama bu
Bu tür tanıtımlar sonuçta bir fon toplama stratejisinin parçası gibi görünüyor
Daha önce de iç modellerin ne kadar kod yazdığı gibi muğlak gönderiler paylaşmışlardı
Bu, ortada somut bir şey olmadığı anlamına gelmiyor ama sonuçları kamuya açık paylaşmamaları hayal kırıklığı yaratıyor
- Diğer model sağlayıcıların aksine benchmark yayımlamıyor olmaları beni hep rahatsız etmişti
  Cursor bir zamanlar çok konuşuluyordu ama şimdi terminal tabanlı ajanlar öne çıkıyor
  Bizim şirket de Cursor sözleşmesini bitirip Claude Code'a geçmeyi düşünüyor
  Muhtemelen bu tarayıcı projesi yeniden ilgi çekmek için bir girişim
- Bu tür abartılar sonuçta sadece piyasa değerini şişirmekten ibaret. Savunulamaz
- Bugünlerde bütün LLM şirketleri gerçekten çok 'vibe-coded' pazarlamaya dayanıyor
  GPT-5 duyurusunda da benzeri vardı. Somut ilerleme yavaşlıyor
- Eskiden bu tür abartılardan nefret ederdim ama artık bunu dünyanın gerçeği olarak kabul etmeye başladım
  Sonuçta cevap güven değil, doğrulama
Cursor benzer bir deneyle bir Excel klonu da yapıyor
GitHub deposuna göre
160 bin workflow'un yalnızca 247'si başarılı olmuş ve çoğu bütçeyi aştığı için başarısız olmuş
Ajanlar bu tür kısıtları hiç umursamıyor
En son commit artık build alıp çalışabiliyor (en azından Mac'te)
Ama yine de hâlâ 3 milyon satırlık bir kod karmaşası
Cursor'ın tanıtım videosundaki sayfa render edilmiyor. Muhtemelen farklı bir build kullanıldı
- cargo check geçiyor ama git log'a bakınca bir şeyler şüpheli görünüyor
  Ajan değil, doğrudan insan eliyle yapılmış düzeltme izleri var
  Commit log analizi'ne bakın
Bence asıl yazı sadece tıklama çekmeye yönelik bir başlıktı
“Binlerce AI ajanı bir tarayıcı yaptı” ifadesi fazla kışkırtıcı
- Artık biri “AI bir tarayıcı yaptı” dediğinde bu örneğe bağlantı verebiliriz
- Aslında çalışmayan projeler haber döngüsünde hızla dolaşıyor
  “Sahte haber” ifadesinin politik olarak kirlenmiş olması üzücü. Bu alan için tam uygun bir ifade
Cursor CEO'su “Rust ile rendering engine ve JS VM'i sıfırdan yaptık” diye iddia etti ama,
gerçek bağımlılık listesine bakınca
html5ever, cssparser, rquickjs gibi Servo tabanlı kütüphaneleri aynen kullandıkları görülüyor
Sonuçta yaptıkları şey Servo'yu sarmalamaktan ibaret ve derlenmiyor bile
- Neden özellikle CSS ve JS'yi kendileri uygulamış gibi iddia ettiklerini anlamıyorum
  Çoğu insan koda bakınca bunu hemen anlayabilir ama herhâlde genel kitlenin kontrol etmeyeceğini düşündüler
  Bu şekilde yanlış algılar yayılıyor ve sonra düzeltilse bile kimse önemsemiyor
- Gerçekte Servo'nun HTML/CSS parser'ları, QuickJS, resvg, egui, wgpu vb. ile kurulmuş
  Bunun 3 milyon satır olması komik
- selectors ve taffy de var ve bazılarında eski sürüm bağımlılıkları kullanılıyor
- JS motoru sadece kişisel bir projenin vendor klasörüne kopyalanmış hâli
  İlgili detaylar için buraya bakın
- Layout kodunun Servo'dan mı alındığını, yoksa Cursor'ın kendisinin mi yazdığını merak ediyorum
  Burası tarayıcıdaki en zor alan
Bu pazarlama yaklaşımının ters teptiğini düşünüyorum
Cursor'ın tasarımı ve UX'i harika ama derinlikli işlerde hata sayısı çok fazla
Claude modelleri eklendikten sonra biraz iyileşti ama hâlâ Antigravity'den kötü
Üstelik $20'lık abonelik limiti de çok çabuk tükeniyor. Modellerin 10 kat daha iyi ve 10 kat daha ucuz olması pek olası görünmüyor
- Çeşitli AI şirketlerinin bug dolu uygulamalarını kullanırken, gerçek iş için hâlâ insan becerisine ihtiyaç olduğunu hissediyorum
  OpenAI'ın iş modelinin reklama kaydığını görünce,
  Google'ın bu teknolojiyi daha gerçekçi anladığını düşünmeye başlıyorum
Bu tür hikâyeler sonuçta 'kazma satanlar' için
Konuyu pek bilmeyen CEO'lar bu tür haberlere kanıp gerçekten insanları işten çıkarabilir