Birkaç aydır Kore geliştirici çevresine bakınca, "token kullanım miktarı doğrudan yetenektir" gibi tuhaf iddiaların dolaştığını görüyorum.
Bununla birlikte, iyi hazırlanmış tek bir PRD ile yapay zekanın her şeyi çözeceği gibi pervasız söylemler de var.
İlk başta bunun topluluklarda sık görülen abartılardan biri olduğunu düşündüm, ama bu iddiaların sanki gerçekmiş gibi durmadan ortaya atıldığını görünce bir an için acaba geri mi kaldım diye düşündüm.
(Oh-my-OpenCode gibi şeyleri görünce daha da öyle hissettim.)
Ama gerçekten araştırınca düzgün tek bir örnek bile bulmak zordu ve yeniden üretmek de fiilen imkânsızdı.
ABD'deki frontier topluluğunda böyle iddialar hiç yoktu; sonra OpenClaw çıkıp ilgi görünce ve OpenAI'nin kurucusunu hemen transfer ettiğini görünce buna daha da ikna oldum.
(OpenClaw'un temel felsefesinin HITL (Human In The Loop) olduğunu görünce.)
Demek ki geri kalan ben değilmişim; Kore topluluğunda dini bir tona bürünen abartılar ve yanılsamalar dolaşıyormuş.
Dün OpenClaw'un kurucusu da
Kod üretebilir ve onu gece boyunca çalıştırabilirsiniz, ama sonuçta ortaya çıkan şey en iyi ihtimalle çöptür.
dedi,
YC CEO'su Garry Tan da buna %100 katıldığını söylüyor.
https://x.com/garrytan/status/2043738478220062813?s=20
Son birkaç aydır bu tür yanılsamalı iddiaların bana doğrudan ve dolaylı olarak zarar verdiği durumları görünce artık buna daha fazla katlanamıyorum.
Keşke bu tür iddiaları ortaya atanlar etkisiz hale getirilse.
Ben Codex'i 5 yıldır kullanan, yapay zekaya oldukça iyimser bakan biriyim.
Bir gün bu tür tam otomasyonun da gerçekleşeceğini düşünüyorum. İnsanların konuştuğu gibi bunun gelecek yıl bile olabileceğini düşünüyorum.
Ama en azından bugün değil.
66 yorum
Eğer bu iddia gerçekten doğru olsaydı, Anthropıc, Google ve OpenAI şimdiye kadar mevcut tüm yazılımların yerine fazlasıyla geçmiş olurdu.
Şirket içinde de artık token’ı çok kullanmak gerekiyor da
ancak o zaman performansa iyi bakıyorlar gibi garip bir hava oluşmuş.
Gerçekten kimin aklından çıktı acaba...
O topluluğun yazısını her gördüğümde gerçekten kurdeşen dökecekmişim gibi geliyor
Bu yazının bilerek böyle yazılmış olabileceğini düşünüyorum.
Ama bir de şu tarafı var.
3 yıl önce hepimizin konuştuğu şey, yapay zeka maliyetlerinin eninde sonunda ucuzlayacağıydı.
Ama öyle olmadı. Daha da pahalanıyor. Hatta Çin yapay zeka modelleri için de durum aynı.
Bu yüzden son dönemde, tek bir iş içinde farklı katmanlardaki modelleri değiştirerek kullanıp maliyeti düşürmeye çalışma yöntemi ya da doğrudan açık kaynaklı modelleri, özellikle de gemma 4'ü (
reasoning traceçok daha kısa) yerelde çalıştırıp ajanlarda kullanma yöntemi gibi yaklaşımlar gündem olmaya başladı. Başta herkesin karşı çıktığı bu fikirler, şimdi oldukça makul görünüyor ve buna bağlı pek çok hareket ortaya çıkıyor. Aynı şekilde yapay zeka da şu anda doğru cevabı olmayan bir mücadele olsa da, sonunda kazananın çok şey elde edeceğine dair güçlü bir inançla ilerleyen bir sektöre dönüşüyor.Sonuç olarak bence anlatılmak istenen bu.
Gürültü; bu, yapay zeka frontier şirketlerinin tanıtım faaliyetlerinde de çok büyük ölçüde görülüyor. Peki bu şirketler yanlış yaptığı için onları kullanmayacak mıyız? Hayır, elbette yapay zekayı kullanacağız. Sadece gürültüye dair bilgiyi ayıklayarak almak gerekir. Memnuniyetsizlik arttığında bu daha da önemlidir.
Gereksiz aksiyon; bu, yatırımda da aynı şekilde geçerli. Yatırımda sonuç alan kişilerin, daha önce başarısızlığı tatmış olma ihtimali yüksektir. "Ben 'asla' zarar etmeyeceğim" zihniyetiyle zaten yatırıma başlamak da zordur; düşüş dönemlerinde yatırım yapmamış olmanın rahatlığını ve yatırım yapanlara karşı yalnızca bir acıma hissini yaşarsınız, gerçek yükseliş dönemlerinde ise sadece hayal kırıklığı hissedersiniz. Aynı şekilde yapay zekada da, sürekli takip eden, kullanan ve çeşitli denemeler yapan kişi sonunda avantajlı olur. Bunu özellikle geliştirici olmayan kişilerde daha güçlü hissediyorum. Geliştirme bilgileri olmasa da sürekli kullanıp araştırarak yazılım bilgisini öğrenen ve daha iyi yazılımlar üreten pek çok insan var. Böyle bir "heves"e sahip insanları yenmek sanıldığından daha zordur. Ben de bunu gerçekten çok sık hissediyorum ve her an kendi hevesimin sönmemesi için çaba gösterdiğimi düşünüyorum.
Sonuç olarak ralph da bir hayal ürünü kavram değil; bir bakıma industrial engineering kavramı, test-time computing açısından avantaj sunduğu kanıtlanmış bir yöntem. Elbette buna bir yanılsama da denebilir, ama yine de buna ilgi duyup yeniden üretmeye çalışırken edindiğiniz deneyimin büyük bir kazanım olacağını düşünüyorum.
Gürültüyü ayıklamak gerektiği doğru, ama "rahatsızsan oturuşunu düzelt" tarzı söylemlerde dikkatli olmak gerektiğini düşünüyorum. Memnuniyetsizliği dile getirmeyi bile sorun edip, "uyumsuz biri gibi davranma, hızla uyum sağlayıp kazanan ol" türü bir mesajın, bugün gördüğümüz kör sonuç odaklılığa yol açtığını düşünüyorum. Elbette bunun kastedildiğini sanmıyorum.
Ayrıca ister Ralph benzeri looping olsun, ister birden fazla modele sırayla sormaya dayanan ensemble yaklaşımı, ister subagent orchestration olsun, bu tür test-time computing yöntemlerinin faydası kanıtlanmış değil. Zaten bugünkü LLM'lere people pleasing behavior enjekte edildiği için, bu süreçlerde ortaya çıkan sonuçlara dikkatle bakıldığında, gerçekten düzeltilmesi gereken şeyi düzeltmekten çok, sadece düzeltmesi söylendiği için olmayan bir problemi uydurup düzelttikleri durumlar da epey fazla.
Hızlı deneyimin en büyük varlık haline geldiği sözünün bugünün çağını iyi anlattığına katılıyorum; ancak bunun kişisel çıkar için bir aracın ötesine geçip kötüye kullanılması elbette eleştirilmeyi hak ediyor. Sanırım asıl yazının teması da, "[ne pahasına olursa olsun hızlı ve çok, herkesten önce] yaklaşımının başarılı bir AI tabanlı geliştirme senaryosuymuş gibi abartılı biçimde pazarlanmasından hoşlanmuyorum" gibi görünüyor.
Yazarın yorumunuzu ancak şimdi gördüm.
Yorum güncellemeleri pek iyi çalışmamış galiba.
Değerli görüşünüz için teşekkür ederim.
Öncelikle ben de kendi görüşümü paylaşmak istiyorum.
Bir memnuniyetsizliği (ben bunu memnuniyetsizlik olarak görmüyorum) dile getirmiş olmanızı sorun etmektense, benim de bu olguya dair bir görüş ortaya koyduğum şeklinde değerlendirirseniz sevinirim. Herkesin memnun olduğu bir durum yaratmak imkansız olduğu için, asıl yazının yazarının da yorum yazan kişinin de görüşlerine saygı duyuyorum. Ancak benim görüşlerimin de saygı görmesi gerektiğini düşünüyorum.
Bence test-time computing, araştırmalarla zaten kanıtlanmış bir örnek. Ancak ensemble yöntemi, bana göre test-time computing kavramından çok context window size sınırını aşmanın bir yolu. 'Düzeltilebilir şeyleri düzeltmek yerine, düzelt denildiği için ortada olmayan bir problemi yaratıp onu düzeltiyor gibi görünen durumlar da çok oluyor.' Bu kısımdaki sorun gerçekten yaşanıyor; bu yüzden bunu harness ile olabildiğince engellemek şu an için en iyi seçenek gibi görünüyor.
Son olarak, 'viral' denilen konuda ben de ciddi miktarda gürültü olduğunu ve bundan hoşlanmayacak çok insan bulunduğunu kabul ediyorum. Ancak harness yapan arkadaşlar bunu aslında açık kaynak olarak dağıtan kişiler olduğu için, burada kişisel çıkar denebilecek bir şey olup olmadığı konusunda şüphelerim var. Hatta bundan hoşlanmayan insanların bile ücretsiz kullanabilmesi için sunup bir de üstüne eleştiri alırken, buna gerçekten kişisel çıkar denebilir mi emin değilim. Elbette korku yaratarak satış yapıyorlarsa bu yanlış bir davranıştır ve eleştirilmeyi hak eder; buna katılıyorum.
Tekrar yazarın görüşleri için teşekkür ederim!
3 yıl öncesine göre gerçekten çok daha ucuzladı.
GPT-4 döneminde ücretli plan kullansanız bile birkaç saat sonra yeniden denemeniz gerektiğine dair bir mesaj alıyordunuz ama şimdi 22 dolarlık plan kullansanız da böyle bir şey olmuyor.
Birim token başına düşünsel yetenek de karşılaştırması zor olacak kadar arttı.
Ama asıl önemli olan, bundan da öte daha fazla token kullanırken LLM sağlayıcılarına daha fazla para ödüyor olmamız (Jevons paradoksu).
Ralph Loop'u hiç denememiş değilim.
Bundan daha iyi olan sub-agent driven development da kullandım.
Ama benim deneyimimin vardığı sonuç da nihayetinde OpenClaw'ın kurucusunun söylediğiyle aynıydı.
Gerçekten tam otomasyon mümkün olursa Ralph Loop gibi şeylerde böyle zorlama yöntemlere de gerek kalmaz herhalde.
En önemli nokta, gerçekte düzgün bir kod da düzgün bir servis de ortaya çıkaramıyor olmaları.
Yazarın görüşüne katıldığım noktalar var.
Birim token başına düşünsel yetenek, GPT-4 ile kıyaslanan fiyat gibi konularda da katılıyorum.
Ancak token fiyatı bir düşüş trendindeyken yeniden yükseliyor ve çıkarım tokenları, iş başına token kullanımı, kişi başına token kullanımı açısından bakıldığında bunun etkisi bireysel kullanıcılar ve AI hizmeti işletenler için oldukça zorlayıcı hale geliyor. Cursor, Intercom, Shopify, Chroma gibi şirketlerin açık kaynak temelli kendi modellerini geliştirmeye başlamasının nedeni de bu. Fiyat rekabetçiliğini neredeyse tamamen kaybetmiş oldular.
Aslında ralph denilen şey çok zorlama bir kavramdan ziyade while tabanlı bir bash script'iydi. Yapısı da o kadar basit. Burada bizim anlamamız gereken şeyin, bunu sistematik hale getirip getirememe mücadelesi olduğunu düşünüyorum. Otomasyon dediğimiz şey de niyeti doğru biçimde çıkarmak, görev bölmeyi tembellik etmeden ve doğru şekilde yapmak, ardından bunu hatasız ve eksiksiz biçimde uygulamak; eğer olmuyorsa hangi kısmın yapılması gerektiğini belirlemek sürecidir.
Ama katıldığım nokta şu: Elbette tüm bu işlerin halk arasında denildiği gibi tek bir "tık" ile olması güzel olurdu, fakat muhtemelen sizin de hisssettiğiniz gibi durum hiç de öyle değil. Hatta mevcut sorunun, kod işinden bile daha fazla ayar gerektiriyormuş hissi vermesi olduğu anlaşılıyor. Ayrıca hizmet tarafında da insanların genelde hissedebileceği belirgin bir şey yok.
Buna karşılık benim çok net hissettiğim bir nokta var: Çoğu insan documentation işini o kadar iyi yapamıyor. Düzenli toparlayamadıkları için bir şeyi sistematik hale getirmekte zorlanıyorlar; bu yüzden de bu tür işleri yürütürken ciddi biçimde zorlandıklarına sıkça tanık oldum. Üstelik yapay zeka da kusursuz değil. Bu açıdan ben bunu bir fırsat olarak görüyorum. Bu işi sürdürenlerle sürdürmeyenler arasında oldukça büyük bir fark oluşacağını düşünüyorum. Dayanıklılığı olan insanlar daha hızlı uyum sağlayacak; çeşitli nedenlerle bunu yapamayanlar ise daha da geride kalıp korkuya kapılacak gibi görünüyor. Aslında yazarın da dediği gibi bu, "korku duyulacak" bir şey değil ki? Daha iyi yönelim de bu bence.
Demek istediğim,
while loopun zorlama bir yaklaşım olduğu.En başta bunun ortaya çıkma nedeni, LLM’in agentic task’larda yeterince iyi olmaması ve erken sonlanmasıydı (EOS token döndürmesi).
Gerçekten AGI’ye yakın, nihai bir model çıkarsa
while loopkullanmaya da gerek kalmazdı.Belgeleme becerim yetersiz olabilir ama Garry Tan ya da Peter Steinberger için durum böyle değildir.
Eğer mesele LLM’in düzgün çalışmamasıysa, gerçekten yeniden üretilebilir bir best practice demosu göstermeniz yeterli olur.
Ama ben bugüne kadar böyle bir şeyi bir kez bile görmedim.
Ben de yazarın görüşüne katılıyorum.
LLM'nin sohbet edebilen ve iletişim kurulabilen bir sistem olduğu yönündeki deneyimsel boyut nedeniyle bazı çarpıtmaların ortaya çıktığı da anlaşılıyor.
Değerli görüşünüz için teşekkür ederim.
O halde, sizce ne tür bir best practice demo gerekli olabilir?
Hangi işin nasıl hayata geçirildiğinde Ralph loop’un bir yanılsama olup olmadığını değerlendirebileceğimize dair görüşlerinizi rica ediyorum.
Üretime hazır seviyede geliştirmeyi, neredeyse kusursuz tek bir PRD ile Ralph Loop’u döndürerek tamamlamak. Kim bakarsa baksın AI slop gibi görünmeyecek şekilde.
Ah, o zaman mükemmele yakın tek bir PRD ile Ralph Loop’u çalıştırıp belli bir seviyede ürün ortaya çıkarabilir miyiz?
Channel Talk’ın yapay zeka sohbetini mi yapmalıyız?
Bir şey daha sormak istiyorum.
Acaba harness denen şeyi kurup bu şekilde ilerlememiz uygun olur mu?
Evet, ister harness olsun ister multi-agent ya da sub-agent, fark etmez.
Görüşünüz için teşekkürler!
Aynen öyle. Böyle örnekler oluşturabilsek harika olurdu haha
Açıkçası bu yazıda, sorunun ortaya konuluşundan çok argümanın ilerleyişi bana daha zayıf geldi.
“Token kullanımı doğrudan yetenektir”, “İyi hazırlanmış tek bir PRD ile AI her şeyi çözer” gibi ifadeler oldukça güçlü iddialar; ama bunları tam olarak kimin, nerede, hangi bağlamda söylediği pek görünmüyor. Bu yüzden okuyan biri açısından, gerçek bir eğilimi eleştirmekten çok, temsiliyeti belirsiz birkaç uç iddiayı bir araya getirip çürütmeye çalışan bir korkuluk safsatası gibi görünüyor.
Özellikle om serisi dahil olmak üzere gerçekten araç geliştiren ve iş akışlarını rafine eden kişilerin, “Tek bir PRD her şeyi çözer” gibi konuştuğunu ben neredeyse hiç görmedim. Aksine sürekli release, düzeltme ve doğrulamayı tekrarlıyorlar. Bunun kendisi bile, en azından şimdilik insan yargısı ve müdahalesinin zorunlu olduğu varsayımına dayandığını gösteriyor bence.
Bu yüzden asıl daha dikkatli olunması gereken nokta şu: Bu tür bir anlatım yanlış okunursa, belirli builder'ların ya da geliştiricilerin gerçekte hiç söylemedikleri şeyleri söylemiş gibi görünmelerine yol açabilir. Böyle bir yaklaşım, sağlıklı bir eleştiriden çok, abartılı bir çerçeve kurup ona saldırmaya daha yakın duruyor diye düşünüyorum.
Token kullanımı için de aynı şey geçerli. Bu, yeteneğin mutlak bir göstergesi değil; ama tamamen anlamsız bir sayı olduğunu söylemek de zor. Kullanım farkı çok büyük ölçüde açılıyorsa, bu basit bir israftan ziyade keşif miktarı, deney miktarı ve doğrulama miktarı farkı olabilir; hatta gerçek iş yoğunluğu farkına da dönüşebilir. Nitekim Jensen Huang da maaşının yarısından fazlası kadar token kullanılması gerektiğini söylemişti.
https://www.youtube.com/shorts/XBnFPuru4xA
İyi bir PRD de bir sihirli değnek değil, bir kaldıraçtır. Bu yüzden sonuçta önemli olan, “token yetenek midir değil midir” gibi basit bir ikilikten ziyade, AI destekli problem çözme becerisini gelecekte hangi ölçütlerle değerlendireceğimizdir.
Yazdığınız metne tamamen katılıyorum.
Aslında “token kullanım miktarı doğrudan yetkinliktir” düşüncesi açıkça yanlış ve çarpıtılmış bir çerçeve.
Aksine, hesaplama kaynaklarının sınırlarının (insanlar dahil) tek darboğaz olduğunu fark ettiğiniz noktada, token kullanımının önemini kavramaya başladığınız şeklinde bakmak gerekir.
Böyle iddialarda bulunan grubun kim olduğunu biliyorum, ancak açıkça belirtirsem hukuki sorunlar çıkabileceği için özellikle anmadım.
Token kullanım miktarını ölçen ünlü şirketler var; aşağıda anonim olarak bundan bahseden biri de var.
GeekNews'te de kendi token kullanımını övünür gibi öne süren yazılar görebiliyoruz.
Bu tür iddiaları dile getirenler çoğunluk değil.
Ama Kore'deki yapay zeka tarafında biraz gürültülü bazı isimler bu iddiaları savunuyor ve Garry Tan'ın son birkaç gündür fat harness'i durmadan eleştirmesi de Kore'deki o dinvari söylemin ABD tarafına kadar geçtiğinin bir kanıtı olsa gerek.
Jensen Huang'ın sözlerini getirip sanki mutlak gerçekmiş gibi öne sürmek tam anlamıyla tipik bir otoriteye başvurma söylemi.
Jensen Huang onlarca yıl önce ekran kartı yapan bir mühendisti; bugün artık mühendis de değil, yapay zeka tarafında uzman da değil.
Korelasyona katılıyorum, ancak benim sözünü ettiğim grubun iddiası yalnızca hiçbir işe yaramayan Ralph'ı döndürmekten ibaret.
Gerçeği söylemek gerekirse, test-time compute'u ilk savunan OpenAI'nin o1 orijinal makalesinde bile bunu sürekli artırmanın sürekli daha iyi sonuç vermediği, ya da yalnızca bazı durumlarda öyle olduğu açıkça söyleniyor.
Üstelik bu bile reasoning effort ile ilgili bir mesele; Ralph loop döndürün denmesi zaten söz konusu değil.
GPT-5.4 prompt kılavuzunda da daha yüksek reasoning effort'un her zaman daha iyi olmadığı açıkça belirtiliyor.
https://openai.com/index/learning-to-reason-with-llms/
https://developers.openai.com/api/docs/guides/prompt-guidance
Bununla da kalmıyor, tasarım tarafında ise aksine reasoning effort'u azaltmanız öneriliyor.
https://developers.openai.com/blog/…
PRD her derde deva olmadığı halde, sanki öyleymiş gibi savunan insanlar olduğu için bunu söylüyorum.
Başlık açıkça Ralph loop adlı bir yanılsama hakkında ne düşündüğünüzü soruyor; ancak asıl metin bu konuyu somut biçimde ele almak yerine çok daha geniş ve farklı bağlamlardaki meselelere dağıldığı için, yazının genelinin başlıkla pek iyi örtüşmediği izlenimini edindim.
Bu yüzden ben, “böyle bir insan gerçekten var mı yok mu” meselesini tartışmadım; metnin kaynağı ve bağlamı belirsiz uç iddiaları bir araya getirip onlara karşı çıkma yapısı nedeniyle bir saman adam eleştirisi gibi okunduğunu söylemiştim.
Ama benim yorumuma verilen yanıt da o noktayı doğrudan açıklamak yerine, sürekli başka kişiler, başka söylemler ve başka örnekler getiren bir akışa sahip olduğu için, açıkçası konuyu bulanıklaştırmaya daha yakın hissettirdi.
Özellikle ünlü kişilerin sözlerini alıntılamayı otoriteye dayalı bir söylem diye eleştirirken, yanıtın kendisinde Garry Tan, OpenAI belgeleri, GPT rehberleri gibi kaynakların yeniden dayanak olarak getirilmesi de biraz seçici göründü.
Token kullanımını aşırı övme kültürünün rahatsız edici olabileceğini düşünüyorum. Ancak bundan ayrı olarak, gerçekten tekrar eden deney, doğrulama ve düzeltme süreçlerinden geçerek araçlarını ve iş akışlarını iyileştiren insanları da aynı çerçevenin içine koymak bence başka bir abartı.
Yazıyı sadece başlığına bakarak mı değerlendiriyorsunuz?
Peki o zaman "Attention Is All You Need" makalesi hakkında ne düşünüyorsunuz?
Garry Tan yakın zamanda GStack gibi iyi LLM becerileri geliştirerek yapay zekayı kullanma yetkinliğini gösterdi.
OpenClaw'ın kurucusu da aynı şekilde ve OpenAI, LLM araştırması ile sektörüne öncülük eden şirketin resmî rehberidir.
Buna karşılık ya Jensen Huang? Sırf kazma satan bir şirketin CEO'su diye altın hakkında da iyi bildiğini söylemezsiniz umarım.
En başta Jensen Huang da sadece bir başkasının söylediklerini tekrarlıyor.
Eğer buna konuyu saptırmak diyorsanız, söyleyecek bir şeyim yok.
Ben o araçları ve iş akışlarını iyileştiren kişiyim; kendi kendimi aşağılamış olduğumu mu söylüyorsunuz?
Ben yalnızca başlığa bakıp hüküm vermedim; başlık ile ana metnin birbiriyle ne kadar tutarlı biçimde örtüştüğünü kastettim.
Ayrıca benim söylediğim şey, Garry Tan ya da OpenAI'nin Jensen Huang'dan daha otoriter olup olmadığı meselesi değildi; başkalarının alıntılarını otoritecilik diye eleştirirken kendi yanıtınızda yine başka bir otoriteyi dayanak olarak getirmeniz, yöntem olarak tutarlı görünmüyordu.
Son olarak, “araçları ve iş akışlarını iyileştiren insanları bile aynı çerçevenin içine koyuyor” ifadesiyle belirli bir kişiyi kastetmedim; anlatım biçiminin o şekilde okunabileceğini söylemek istemiştim. Bunu hemen “buna self diss mi dediniz?” şeklinde almak, sanırım yorumumun kapsamını biraz aşan bir yorum olmuş.
Ayrıca başlıkla gövdenin farklı olabileceğini düşünüyorsanız, bu yazının Ralph loop’un kendisine yönelik bir analizden ziyade, bahsettiğiniz belirli grubun genelini hedef alan bir yazı olarak anlaşılması gerekip gerekmediğini merak ediyorum.
Çünkü yapay zeka/LLM uzmanı bile olmayan Jensunghwang'ın sözlerini alıntıladınız.
Evet, bu belirli bir grubu hedef alan bir yazı.
Onların içindeki en temsilî ve aynı zamanda en tuhaf söylem olan PRD + Ralph loop'tan bahsettim.
Böyle bir grubun varlığını bilmiyor musunuz, yoksa siz o grubun içindesiniz de bilmiyormuş gibi mi yapıyorsunuz, bilmiyorum.
Yurt içinde ve yurt dışında bu tür grupların sürekli eleştirilmesinin bir sebebi var.
Ateş olmayan yerden duman çıkmaz.
Ve kişisel olarak bu yazıyı oldukça hayal kırıklığı yaratan bir metin olarak buldum.
GeekNews’i, belirli bir kişi ya da grubu hedef alan yazılardan çok, benim bilmediğim bilgilerle, yeni bakış açılarıyla ve düşünceyi genişleten içeriklerle karşılaşabildiğim için değerli buluyordum.
Bu yüzden, bu kez olduğu gibi anlatının belirli bir grubu ön kabul olarak alıp akması, bana daha da üzücü geldi.
En azından benim için GeekNews, birilerini bir çerçeveye sokup hedef alan bir yerden ziyade, daha somut bilgi ve bağlam üzerinden düşünceyi genişletmeye yardımcı olan bir yere daha yakın. Bu yüzden bu yazıda beni asıl hayal kırıklığına uğratan şey, iddianın kendisinden çok, o iddianın kurulma ve geliştirilme biçimi oldu. Şimdilik bu kadarını bırakayım.
Bunu kaç kez söylemem gerekiyor.
Belirli bir grubu ya da kişiyi doğrudan hedef almak benim açımdan uygun değil.
YC CEO’su ve OpenClaw’ın kurucusu, yapay zeka uzmanı denebilecek kişiler olduklarını bizzat kanıtlamış insanlardır. Jensen Huang gibi değiller.
PRD’nin bir yanılsama olduğunu söylediğim olmadı. Biraz bağlama bakın.
Böyle yanılsamalı iddiaların büyüdüğü şu anda, bu mesele sadece benim kişisel öfkemi aşan; Güney Kore’nin yapay zekası, hatta insanlığın gelişimiyle ilgili bir konudur. Bu insanların daha da büyüyüp başka tarafta etki kazanmadan önce bu simyayı düzeltmek gerekmiyor mu?
Kişi kendisi değilse geçip gidebilir. Zaten bu yazının diğer yorumlarında bana katılanlar da oldu, benim sözünü ettiğim grubun insanları da beni saldırmak için buraya geldi.
Bir noktayı daha eklemek isterim: “Güney Kore’nin yapay zekası”, “insanlığın gelişimi”, “simyayı düzeltmek gerekir” gibi ifadeler, önce biraz fazla büyük bir meşruiyet zemininin öne sürüldüğü izlenimini verdi. Böyle bir sorun bilincine sahip olunabileceğini düşünüyorum. Ancak bu düzeydeki bir anlatının, topluluk içinde birilerini genişçe gruplandırıp eleştirme biçiminden ziyade, somut örnekler ya da çalışmalar ve daha net doğrulama ölçütleriyle birlikte sunulduğunda çok daha ikna edici aktarıldığını hissettim.
Ayrıca YC CEO’sunun ya da OpenClaw kurucusunun sözlerini anlamlı bir dayanak olarak kabul ederken, yalnızca Jensen Huang alıntısını özellikle otoriterlik gibi ele alma biçimi de bana tutarlı görünmedi. Sonuçta kimin sözü dayanak sayılıyor, kimin sözü anlamsızlaşıyor; bunun ölçütünün iddianın kendisinden çok konuşana göre değiştiği izlenimini verdi. Jensen Huang’ın sözü belirleyici bir kanıt olmayabilir, ama buna rağmen yalnızca o alıntıyı özellikle değersiz bir söz gibi muamele etmek bana biraz aşırı bir yorum gibi geldi.
Sonuç olarak, böyle bir iddianın başkalarına da anlamlı gelmesi için, eleştiriyi tekrarlamaktan ziyade doğrudan başvurulup doğrulanabilecek örnekler ya da çalışmaların da birlikte sunulması gerektiğini düşünüyorum. Ancak o zaman burada işaret ettiğiniz yön, basit bir antipati değil, gerçekten ikna edici bir sorun ortaya koyma çabası olarak okunabilir. Böyle çıktılar varsa, ben de o zaman bunları aktif biçimde okuyup incelemek isterim; gerekirse doğrudan kullanmayı da denerim.
Tautolojiyi bırakın lütfen. Söylemediğim şeyleri söylemişim gibi davranıyorsunuz ve yanıtladığım içerik hakkında yine soru işaretleri ortaya atıyorsunuz.
Açıkçası, şu an yazıyı ve yanıtları birlikte gördükçe bunun bilgi ya da analiz amaçlı bir yazıdan çok, belirli bir akışı eleştirmek isteme duygusunun daha önde olduğu bir yazı gibi hissettirdiğini düşünüyorum.
Gerçekten titiz bir eleştiri yapmak isteseydiniz, toplulukta fiilen hangi yazıların yer aldığını ve kimin hangi bağlamda hangi iddiayı öne sürdüğünü daha açık biçimde ortaya koyabilirdiniz diye düşünüyorum. Ama böyle somut örnekler yerine önce “Koreli geliştirici camiası”, “öyle gruplar”, “dini andıran abartı” gibi geniş ifadelerle meseleyi paketleyince, okuyan tarafta asıl iddialardan çok çağrışım ve çerçeve daha güçlü kalıyor.
Özellikle om çizgisini çağrıştıran ifadeler ortaya atıp sonra da aslında belirli bir grup ya da kişiyi doğrudan hedef almadığınızı söyleme biçiminiz, bunun bilgi amaçlı bir yazıdan çok birilerini genişçe suçlamak isteme hissi verdiğini düşündürüyor.
Üstelik tepki veren kişilere “kendisi değilse geçip gidebilir”, “ya empati kuruyor ya da benim sözünü ettiğim grubun insanları saldırmaya geldi” tarzında yaklaşmanız da tartışmadan çok damgalamaya yakın geliyor. En başta yazıyı bu kadar güçlü bir çerçeveyle açarsanız tepki ve karşı görüş çıkması zaten doğal; ama o tepkileri tekrar belirli bir grubun parçası gibi yorumlayınca, sonuçta her itiraz yeniden o çerçevenin içine emilmiş oluyor.
Bence tam da bu tarz, bilgi ve bağlam paylaşan bir yazının dilinden çok, topluluk içi karşıtlık kurgusu üreten bir dilin mantığına daha yakın. Ve açık konuşmak gerekirse, bu tür bir üslup X ya da Threads gibi mecralarda tanıdık olabilir ama en azından benim GeekNews'ten beklediğim atmosferle arasında mesafe var; bu yüzden daha da üzücü buldum.
Ben GeekNews'i, insanları geniş kategoriler altında suçlayan bir yerden çok, doğrudan deneyim edilmiş şeylerin, somut bilgilerin ve düşünce ufkunu genişleten bağlamların paylaşıldığı bir alan olarak gördüm. Bu yüzden bu yazıda beni asıl rahatsız eden şey, iddianın kendisinden çok onun ele alınış biçimi oldu.
O halde sonuçta bu yazıyı Ralph loop’un kendisini analiz eden bir metinden çok, bahsettiğiniz belirli bir grubun genelini hedef alan bir yazı olarak anlamak daha doğru gibi görünüyor.
Ancak bana göre böyle bir yazıysa, hedefin tanımı da o kadar daha titiz olmalı. Sadece “öyle bir grup var”, “yurt içinde ve dışında sürekli eleştiriliyor” gibi ifadelerle, gerçek iddialar ile abartılı çerçeveler net biçimde ayırt edilemiyor ve sonuçta farklı insanları ve bağlamları tek bir yere toplayan bir yaklaşım gibi okunmaya çok açık oluyor. “Belirli bir grup” ölçütü başlı başına zaten güçlü bir çerçeve; bu sınırlar belirsizken karşı tarafı onun içine yerleştiren türden bir yanıtın, tartışmayı inceltmekten çok daha da kaba hale getirdiğini düşünüyorum.
Ayrıca başkalarının sözleri ve örnekleri sürekli dayanak olarak kullanılırken, yalnızca Jensen Huang alıntısının özellikle otoriterlik olarak ele alınması da bana tutarlı gelmedi. OpenClaw kurucusu ya da YC CEO’su da kendi bağlamları ve otoriteleri olan kişiler; bir tarafın alıntısı meşru bir gerekçe sayılırken diğer tarafın alıntısı doğrudan anlamsız hale geliyorsa, ölçütün artık iddianın kendisinden çok konuşana göre değiştiği izlenimi doğuyor. Aslında bu kişilerin de azımsanmayacak ölçüde hesaplama gücü ve kullanım hacmi üzerinde deney yapıyor olmaları muhtemel; bir tarafı yetkinliğin kanıtı gibi, diğer tarafı ise bir yanılsamanın simgesi gibi okuyacaksak, önce bu ayrımın ölçütü çok daha açık olmalı diye düşünüyorum.
PRD de elbette her derde deva değil; ama bu onun rolünü de bir yanılsamaymış gibi bir kenara itmemizi gerektirmiyor. Bu yaklaşım, gerçek geliştirme süreçlerindeki yinelemeli sürüm çıkarma, doğrulama ve düzeltme döngüsüyle de pek örtüşmüyor. Rahatsız edici bir kültür olabilir, ama bu rahatsızlığın doğrudan geniş genellemelere dayanak olamayacağını düşünüyorum. Burada bırakayım.
oh-my-whatever ve çeşitli token leaderboard’ları gibi şeylerin hepsinin pazarlama için üretilmiş gürültü olduğunu düşünüyorum.
Bir harness yapıp gerçekten işe yarar bir şey çıkarmaktan ziyade, sadece daha karmaşık ve token yakmaya optimize edilmiş bir harness ortaya çıkma oranı daha yüksek; ama en görünür olan ve kısa vadede dikkat çekmesi en kolay şey bu olduğu için buna coşkuyla yaklaşan çok kişi var gibi geliyor.
Buna uyum sağlayamamanın tam bir loser zihniyeti olduğunu söyleyenler de varmış. Bundan yola çıkarak Kore’nin hızlı, SF’nin ise yavaş olduğu iddiasını öne sürenler de var.
Ama Ralph Loop olsun, harness olsun, bu tür şeylerin hepsi sonuçta modelin iç işlevleri tarafından emilecek ve o zaman iyi hazırlanmış tek bir PRD ile yapay zekanın çözüm üretmesi abartı sayılmayacak diye düşünüyorum.
Buna karşılık şu anda harness’i türlü taklalar attırarak sanki müthiş bir şey yapılıyormuş gibi paketleyip tekrar tekrar pazarlamak, bence number go up tipi bir clicker game bağımlılığından çok da farklı değil.
https://x.com/WillManidis/status/2021655191901155534 Biraz eski ama bu yazı da benzer bir bağlamdaydı.
Popüler olması, o kadar ortalamaya yakın olduğu anlamına gelmiyor mu? Yüksek bir seviye değil, sıradan bir seviyede tatmin edici olan... Ama bu iş fazla ileri giderse araç cezalandırılır. Hâlâ C mi Java mı diye hararetli tartışan insanlar var.
Bence ortalama seviye aslında Ralph Loop ve Hannes'ten epey uzak; daha çok düz
claude codeseviyesinde. Açıkçası örneklemi biraz geniş tutarsanız, sadece Claude Code kullanmış olmanın bile ortalamanın üstü sayılacağını düşünüyorum.Eğer bunlar ortalama gibi görünüyorsa, bence bu onların FOMO pazarlamasının başarılı olduğu anlamına gelir.
Ralph Loop adlı bir yanılsama hakkında ne düşünüyorsunuz?
Yeni bir simyacılar çağının geldiğini mi düşünmeliyiz?
Katılıyorum
Kesinlikle katılıyorum
Bana kalırsa bunlar sadece Kore'de benzer türde influencer olmak isteyen insanlar.
Güzel yazıyı paylaştığınız için teşekkürler
AI kodlama, HITL de bağımlılık yapabiliyor.
Buna bakınca, insanların bir şeyler üretmeyi sevmesine dair içgüdüsel bir taraf gerçekten var gibi görünüyor
Alay etmeyin; bilmiyorsanız en azından araştırın.
OpenAI Codex'i Chrome uzantısı olarak kullanma
Copilot açıklaması ve kullanım deneyimi
codex5 yıl önce miydi...? ChatGPT de 2022’de çıktığı için henüz 5 yıl olmadı...Yoksa Ask GN metnini de yapay zekaya yazdırdınız da halüsinasyon mu karıştı?
Codex’in kendisi zaten eski. Ben de GeekNews’te görüp GPT-3 önizlemesine başvurduğumu hatırlıyorum.
GPT-3 önizlemesi ile Codex arasında nasıl bir ilişki olduğunu öğrenebilir miyim?
O dönemde Codex’in var olduğunu mu söylemek istiyorsunuz? Yoksa kod yazan bir yapay zeka vardı ve bunun Codex olduğunu mu söylemek istiyorsunuz?
Eski deprecated model serileri arasında
code-davinci-*,code-cushman-*ailesi Codex modeliydi. Codex markasının kendisi zaten oldukça eski.https://www.youtube.com/watch?v=SGUCcjHTmGY
Elbette codex adının aynı olduğu söylenemez, ancak bir code modelinin var olduğu anlaşılıyor.
Vay canına, bu biraz sarsıcıymış. Ben de
gpt-2,dall-e,gymdönemlerinden beri kullanan biriyim amacodexdiye bir model adını ilk kez gördüm. Bilgilendirdiğiniz için teşekkür ederim!Ek olarak, codex 2025 Mayıs'ta piyasaya sürüldü.
ahahahahahahahahahahaha
Bilmediğinizi belli etmeden önce en azından bir kez NamuWiki'ye bakmaya ne dersiniz?
Aa, bu arada ChatGPT Atlas, üye oluşumun 1812. günü olduğunu söylüyor.
Aha, yani mevcut codex ile o zamanki codex farklı biçimlerde ürünlermiş.
O zamanki codex, OpenAI'ın kod odaklı LLM modelinin adıymış,
aynı markayı kullanarak şu anki codex platformunu piyasaya sürmüşler.
Ben o dönemde GitHub Copilot kullanmıştım ve yalnızca temel modelin GPT-3 olduğunu biliyordum,
model adında codex markasının kullanıldığını ise bilmiyordum.
Codex bir model değil.
GPT-5.3-Codexgibi adlandırmalar ise ancak yakın zamanda ortaya çıktı.Bu, GPT-3 tabanlı kodlama için fine-tune edilmiş bir modeli kullanılabilir hale getiren VSCode eklentisinin adı.
(web’i kimse kullanmıyor)
Aynı model ve yaklaşım Github Copilot’ta da kullanıldı.
O dönemde anlamlı bir sohbet kurulamıyordu; yani kelimenin tam anlamıyla bir sonraki kelime tahmini gibiydi.
Sadece, bir Baekjoon problemi yazınca
solvefonksiyonunu yazan nihai otomatik tamamlama gibi bir şeydi.(Yani OpenAI, Cursor’dakine benzer şeyi önce yaptı.)
Bahsettiğiniz şeyin, codex modelini kullanan bir VSCode eklentisi olduğu anlaşılıyor (acaba bu mu? https://github.com/Implicate-dev/codex-vscode)
Mark Chen'in 2021'de yayımladığı makaleye bakılırsa, OpenAI o dönemde Codex'i fine-tune edilmiş modelin adı olarak duyurmuş gibi görünüyor.
Öyle gibi görünüyor ama eski olduğu için tam olarak hatırlamıyorum.
Ralph Loop adlı yanılsama hakkında ne düşünüyorsunuz?
https://www.youtube.com/watch?v=SGUCcjHTmGY
Bunun Kore siteleri yerine Amerikan sitelerinde token kullanımının yüksek olması gerektiği yönündeki söylemleri görünce şaşırdığımı hatırlıyorum. Sadece Kore’de değil, Amerika’da da durum aynı; garip, kabul etmesi zor iddialar ve abartılı anlatılar ortalıkta dolaşıyor.
Kore'de neredeyse yarım yıl öncesinden beri bu tür iddialar ortaya atılıyordu; sanki son zamanlarda bu konu çok daha sert biçimde konuşulmaya başlandı.
Garry Tan gibi isimler de buna aktif biçimde hayır diyor.
Biraz farklı bir bağlamdaki konu olsa da, daha ucuz donanım üzerinde daha fazla token harcayarak doğrulama yapmanın, pahalı bir bulut API’si kullanıp token tasarrufu yapmaktan daha iyi olduğu düşüncesindeyim.
Ajanların ve harness’lerin gelişmesiyle birlikte, modelin hassasiyeti ve boyutundan ziyade daha fazla inceleme ve doğrulamayı mümkün kılan, ekonomik açıdan verimli yapılar daha çok tercih ediliyor gibi görünüyor.
Bence GDN ve Mamba’nın ortaya çıkışından sonra bu durum özellikle daha da belirginleşti.
Ben şahsen buna katılmakta zorlanıyorum.
Opus örneğinde aşırı pahalı, ancak fiyatı GPT-5.4 seviyesindeyse Çin yapımı ucuz bir modeli bütün gün çalıştırmaktansa 5.4’ü birkaç kez çalıştırmak, çeşitli ekonomik açılardan daha iyi olacaktır.
Bana göre, dünyadaki öğrenme verimliliği en yüksek profesyonel oyuncuların bile yeni şeyleri öğrenemeyip başarısız olma oranının yüksek olmasının nedeni, basitçe yetenek eksikliği değil.
Hatta tam tersini düşünüyorum.
Çok uzun süre boyunca ve çok yüksek bir seviyede mevcut metaya optimize olmuş oldukları için, değişim karşısında daha büyük zorluklar yaşamaları sık görülüyor diye düşünüyorum.
Başlangıçta tüm kararlar bilinçli olarak verilir.
Ama tekrar eden öğrenim biriktikçe, ilk başta beyinde işlenen kararlar giderek otomatikleşir ve uzmanlar, düşündüğünden önce bedenin tepki verdiği bir aşamaya ulaşır.
Bu otomasyonun kesinlikle muazzam bir güç olduğunu düşünüyorum.
Ancak meta değiştiği anda, bu gücün tersine güçlü bir atalete dönüşebileceğini düşünüyorum.
Eski metada doğru cevap olan görüş, çatışma ve oyun yönetimi hissi binlerce saat boyunca bedene kazınır.
Bu yüzden oyunun yapısı değişip önceki doğru cevap artık doğru olmaktan çıktığında bile bedenin önce eski şekilde hareket etmeye çalıştığını düşünüyorum.
Sonuçta sorun, yeni şeyler öğrenme becerisinin yetersiz olması değil, mevcut optimizasyonu bırakabilme becerisinde yatıyor diye düşünüyorum.
Çünkü uzmanlığın büyük kısmı birikimin sonucu olduğu kadar, aynı zamanda atalettin de sonucudur.
Bu yüzden, daha önce iyi olan insanların bir sonraki metada da koşulsuz olarak avantajlı olacağını düşünmüyorum.
Hatta önceki dönemin başarısına daha güçlü biçimde bağlı kalma ihtimallerinin de oldukça yüksek olduğunu düşünüyorum.
Bugünün yazılım sektörü de bence çok farklı değil.
Pek çok kişi hâlâ verimliliği eski yöntemlerle hesaplıyor ve üretkenliği eski ölçütlerle değerlendiriyor.
Ama bence meta zaten değişiyor.
Eğitim ya da kariyerden bağımsız olarak, dünyada gerçekten olup bitenlere baktığımızda, pazarın hâlâ geçmişle tamamen aynı yapıda işleyip işlemediğini ve geliştirmenin hâlâ yalnızca bağımlı bir değer sunup sunmadığını yeniden düşünmek gerekiyor bence.
Sonuçta bir sonraki aşamaya geçenler, sadece daha disiplinli şekilde biriktirenler değil, mevcut olanı daha hızlı bırakabilenler olacaktır diye düşünüyorum.
Benim gördüğüm kadarıyla yeni çağda, daha fazla biriktirme yeteneğinden çok, eskimiş optimizasyonları söküp atabilme yeteneği çok daha önemli hâle geliyor.
Öyle düşünüyorsanız, 24 saatlik canlı yayın bile yapıp bunu doğrudan gösterirsiniz.
O
Güzel fikir için teşekkürler.
Gerçekten tecrübe fark yaratıyor 👍👍👍👍👍👍👍👍👍
Olmayacağına dair uzun açıklamanızı dinledim.
Katılıyorum, ancak omo gibi iyi hazırlanmış harness setlerinin geliştirmeye yardımcı olduğunu düşünüyorum (Ralph Loop'un ana konu olmadığını biliyorum. Bir seçenek olarak sunulmuyor mu? ulw miydi..?)
Sadece sonuca gelecek olursam, bunun token kullanımıyla hiçbir ilgisi yok gibi görünüyor.
Otomasyon konusunda geliştiriciler arasında köklü bir kültür var; bu da ortak biçimde bakılan bir mesleki başarı hedefi gibi konumlanmış durumda.
Sanırım bu da insanlarda sabaha kadar otomatik olarak kod yazan ya da ürün geliştiren şeylere dair bir yanılsama yaratıyor.
Aslında geliştirici bakış açısından değil de gerçek iş faydası ya da iş operasyonu açısından bakıldığında, performans, işçilik kalitesi ya da hızlı tepki vermektense problemi ölçmek ve çözüm bulmak daha önemli görülen çok fazla alan var...
Sıkça, iyi bir uygulama ya da iyi bir hizmet yaparsan büyük başarı yakalanacağına dair geliştiricilere özgü yanılsamaların durumu çarpıttığını düşünüyorum.
Evde yere dökülmüş birkaç saç telini toplamak için gereken şey 500 çeşit yüksek performanslı süpürge değil, sadece parmaklarımın yerini alacak basit bir şey.
Token tüketimi, oturum yönetimini kötü yaparsanız ya da SDD'yi yanlış kullanırsanız, basit bir sunucu geliştirmede bile Claude ölçütünde 2-3 günde 100 doları yiyebiliyor.
Token tüketiminde neyin yanlış olduğuna dair spesifikasyon net olmadığı için, kişinin bunu yanlış kullandığını kendi başına değerlendirmesi de zor oluyor.
İçeriği bir yana, token tüketim miktarını yapay zeka kullanımının ölçütü saymak; çok yemek yemenin yetenekli olmak anlamına geldiğini söylemekle ya da şirkette sabaha kadar kurşun kalemle mevcut belgeleri yeniden yazarak çok çalıştığını iddia etmekle aynı şey gibi geliyor.
Şu anda doğru bir ölçüt olmadığı için token tüketimine ve otomasyona odaklanılıyor,
amma bir sonraki aşamada yakında gerçekten somut değer üretmenin yolları üzerine tartışmaların başlayacağını düşünüyorum.
Aslında ABD'nin de çok farklı olduğunu sanmıyorum. Oh-my türü kodlama harness'larının durumu, proje ekibinin Kore merkezli olması nedeniyle ABD dahil yurt dışında daha az pazarlanmış olmalarından kaynaklanıyor; ayrıca tipik token maksimalistleri olan Steve Yegge ve Karpathy'nin savunduklarına bakınca, söylediklerinizden çok da farklı olmadıklarını görüyorum. Takipçileri de öyle.
Şirket içinde token kullanım liderlik tablosu oluşturup şirketler arasında da rekabet ettiriyorlar ama ben kişisel olarak bunun yapay zeka şirketlerinin pazarlamasına kanmak olduğunu düşünüyorum.
Son zamanlarda viral olan şeylere bakınca, token başına performansın hiç dikkate alınmadığı görülüyor.
Komik olan şu ki, yapay zeka şirketleri böyle bir pazarlama yapmıyor.
Hatta önceki modellere kıyasla daha az reasoning token ile daha iyi performans elde ettiklerini söylüyorlar.
5 yıl önce...? Acaba hisse senedi tavsiyesi verebilir misiniz?
Samsung Electronics.