Şirketin özü zaten buysa, neden ancak şimdi? diye düşünüyorum.

 

Codex’in SOTA olmadığını ancak onu kullanmamış ya da bu alana ilgi duymayan kişiler söyleyebilir.

 

En azından bir bayrak olması çok daha kullanışlı olur gibi görünüyor. En sık görülen değer ile geri kalanını farklı biçimde göstermesi de iyi olabilir diye düşünüyorum.

 
alfenmage 6 일 전 | üst yorum | konuda: Veritabanı Gerçekten Gerekli mi (dbpro.app)

O seviyenin tam olarak ne olduğunu, seviyeyi değerlendirme nedeninin ne olduğunu, mantık/fakt/bilim/istatistikten en az ikisini kullanarak söyle bakalım, evet evet

 
alfenmage 6 일 전 | üst yorum | konuda: Veritabanı Gerçekten Gerekli mi (dbpro.app)

"Hayır" deyince herkes Ilbe mi oluyor? Ben Gyeongsang-do'luyum da?

 

Sadece 2 saat yaparsanız renk körü olursunuz.

 

Şeytanın avukatlığı gibi şeyleri Gemini’nin Gems gibi bir özelliğiyle önceden ayarlayıp bırakmak kullanışlı olurdu.

 

SWE-Bench-Pro günlük benchmark’ında (seçilmiş set) Claude Code’a bakınca ilginç bir şey görünüyor

4/10~4/20 aralığında runtime yarıya inmiş (653s→345s), tool call yarıya düşmüş (3.3K→1.8K), token sayısı %18 azalmış ama pass rate ise aksine +16 puan artmış. Dört eksenin de aynı anda iyi yöne hareket etmesi çok sık görülen bir patern değil

Bu süreçte patlayan 3 olayın postmortem’i 4/23 tarihli; bakınca hepsinin de "token/latency azaltmaya çalışırken" ortaya çıktığı görülüyor

Öte yandan codex (gpt-5.4-xhigh) için aynı dönemde rakamlar neredeyse hiç oynamamış. Pass rate yaklaşık %56 civarında sabit, token/runtime/tool call da Claude Code’un iki katı seviyesinde kalmış durumda

 
carnoxen 6 일 전 | üst yorum | konuda: Bir bulut inşa ediyorum (crawshaw.io)

Sadece sürükle ve bırak ile servisleri birbirine bağlayabilmek güzel olurdu

 

Kullanan kimse olmasa da kendi başıma hevesle geliştirdiğim evcil npm kütüphanemin performansını optimize ediyorum.
Aklıma gelen hipotezlerin çoğunun benchmark çalıştırınca işe yaramadığı sonucuna vardım; bu yüzden bununla ek performans optimizasyonu yollarını bir kez çıkarmam gerekecek sanırım.

 

"yapmalı"dan ziyade, "yapsa daha iyi olur" gibi bir ifade daha uygun olabilir ~

 
shakespeares 6 일 전 | üst yorum | konuda: Teknik borç, bilişsel borç, niyet borcu (martinfowler.com)

Değişime uyum sağlamak için organizasyonu hızla yeniden yapılandırmak da bana biraz muhafazakâr bir yaklaşım gibi geliyor ve bu yüzden ters etki yaratıyor.

 

Yapay zeka geliştikçe, o alanda çalışan insanların inançları ve değerleri üzerinde de büyük etkiler yarattığı bir dönemdeyiz.
İnsan, elinden gelenin en iyisini yaparak çalıştığı şirketin insanlığa fayda sağlayan bir şirket olmasını ister; bunun tersini ise kimse istemez herhalde.

Şirketin bakış açısını da anlayabiliyorum ama Palantir içindeki çalışanların huzursuzluğunun bundan sonra da daha da artacak gibi görünüyor

 
xguru 6 일 전 | üst yorum | konuda: Bir bulut inşa ediyorum (crawshaw.io)

Şimdi dönüp bakınca "neden şimdi?" diye düşündüm ama...
Yazarın Tailscale'in ortak kurucusu olduğunu görünce nedense desteklemek istedim.
Lütfen güzel yapın!

 

https://x.com/DongwooKim/status/2047499005580738657
Seul Namsan’ı çevirdim; oldukça sevimli ve güzeldi.

 

claude.ai web tarafında da kullanılabilirliğin ufak ufak kötüleştiği hissediliyor... Token tasarrufu için belleği de kapattım.

 

Tanıtım videosuna bakınca bir denemek istiyor insan ama... 3 saat bekleyin diyor. Herhalde inanılmaz bir yığılma var.

 

Bu duyuruyu gördükten sonra nedense Anthropic’e daha da az güven duymaya başladım.

Yukarıda ilgili iki yazı var; bu iki yazının arasında 7 ay fark var. Sorunlar yine aynı şekilde üçer tane.

Claude’daki son üç kalite düşüşü sorununun postmortemi 2025-09-19
Son Claude Code kalite raporlarına ilişkin güncelleme 2026-04-24

 

Bu bir arıza postmortemi değil de maliyet düşürme postmortemi olmasın?

 

Doğru cevap bu, ama bahane fazla uzun olmuş haha