Uber COO, tokenmaxxing için yapılan harcamaları gerekçelendirmenin giderek zorlaştığını söylüyor

(businessinsider.com)

4 puan yazan GN⁺ 2026-05-27 | 3 yorum | WhatsApp'ta paylaş

Uber’in COO’su, yapay zeka harcamalarının yapılan yatırım kadar sonuç üretip üretmediğini gerekçelendirmenin giderek zorlaştığını düşünüyor
Uber CTO’sunun 2026 Claude Code bütçesinin tamamının şimdiden harcandığını açıklamasının ardından şirket içindeki tartışma büyüdü
Daha fazla token kullanımının, faydalı tüketici özelliklerinde orantılı bir artışa yol açtığını gösteren bağlantı henüz doğrulanmış değil
Uber CEO’su, yapay zeka yatırımlarını dengelemek için Uber’in işe alım hızını yavaşlattığını söyledi
Big Tech’teki tokenmaxxing akımının aksine Duolingo, çalışan tepkisinin ardından yapay zeka kullanımını performans değerlendirmesine dahil etme kararını geri çekti

Uber içinde yapay zeka maliyetlerini gerekçelendirme sorunu

Uber Operasyon Direktörü Andrew Macdonald, şirket içinde yapay zeka maliyetlerini gerekçelendirmenin giderek zorlaştığını düşünüyor
Cumartesi günü yayımlanan Rapid Response röportajında, yapay zekanın şirketin harcadığı para kadar etki üretmediğini söyledi
Uber CTO’su Praveen Neppalli Naga’nın nisan ayında The Information’a verdiği röportajda Uber’in 2026 Claude Code bütçesinin tamamını şimdiden harcadığını söylemesinin ardından şirket içindeki tartışma büyüdü
Bu açıklama, Macdonald’ın “kafamın patlayacakmış gibi hissettiğim an” diye tarif ettiği bir duruma yol açtı ve şirket içinde AI token tüketimi ile çalışan sayısı arasındaki ödünleşim tartışılmaya başlandı

Token kullanımı ile ürün çıktıları arasındaki bağın eksikliği

Macdonald, Uber’in kıdemli mühendislik liderleriyle konuştuktan sonra, daha fazla token kullanımının faydalı tüketici özelliklerinde orantılı bir artışa yol açmadığı sonucuna vardı
“Bu bağlantı henüz yok” diyerek, daha fazla özelliğin yayınlanıyor olabileceğini ancak bunu belirli metriklerle doğrudan ilişkilendirip “artık gerçekten %25 daha fazla faydalı tüketici özelliği üretiyoruz” sonucuna varmanın zor olduğunu söyledi
Yapay zeka harcamalarını çıktılarla doğrudan ilişkilendirmek zorlaştıkça, bunun getirdiği ödün maliyetini gerekçelendirmek de zorlaşıyor
CEO Dara Khosrowshahi, bu ayın başındaki bilanço görüşmesinde Uber’in yapay zeka yatırımlarını dengelemek için işe alımı yavaşlattığını söyledi

Kullanıcıya ücretsiz gibi geliyor ama maliyeti şirket ödüyor

Macdonald, maliyeti kullanıcının ödemediği ve sadece “ilginç kullanım senaryoları” düşündüğü durumda yapay zekanın ücretsizmiş gibi görünebileceğini düşünüyor
Ancak nihayetinde maliyeti şirket ödüyor
Yapay zeka kullanımının genişlemesi artık yalnızca bir verimlilik deneyi değil; bütçeyi ve iş gücü planlamasını etkileyen bir maliyet yapısı olarak ele alınıyor

Big Tech’teki tokenmaxxing’den farklı bir akış

Big Tech, mümkün olan en yüksek düzeyde yapay zeka kullanımı anlamına gelen tokenmaxxing yaklaşımına güçlü biçimde yönelmiş durumda ve bazı şirketler çalışanların yapay zeka kullanımını değerlendirmeye katıyor
Meta, Google, JPMorgan, yapay zeka kullanımını performans değerlendirmeleri, hedefler, zamlar ve terfilerle ilişkilendiren şirketler arasında gösteriliyor
Buna karşılık bazı şirketler, yapay zeka kullanımını kendi başına zorlayan yaklaşımdan geri adım atmaya başladı
Duolingo, çalışanların “yapay zekayı sadece yapay zeka kullanmak için mi kullanmalıyız?” diye sormasının ardından, yapay zeka kullanımını performans değerlendirmesine dahil etme kararını geri çekti
Duolingo CEO’su Luis von Ahn, nisan ayındaki bir podcast röportajında bunun, gerçek sonuçlardan sorumlu tutmaktan çok bazı durumlarda uygun olmayan bir şeyi zorla dayatmak gibi hissettirdiğini söyledi

3 yorum

roxie 7 일 전

Şimdi dönüp bakınca, sonuçta şirketlerin hepsinin token harcamalarında kemer sıkma sürecine girdiği bir duruma evriliyor gibi görünüyor.

colus001 2026-05-27

Tokenmaxxing gerçekten çok tuhaf görünüyor. Kamyon ne kadar çok yakıt harcarsa o kadar iyi denmesi de ne anlama geliyor, anlamak zor. İnsan Jensen Huang'ın oyununa gelinmiş olabileceğini düşünüyor.

GN⁺ 2026-05-27

Hacker News yorumları

2007~2009 arasında Google'ın veri merkezlerini büyük ölçüde büyüttüğü dönemde, özellikle mesai dışı saatlerde atıl kapasite çok fazlaydı
Mühendisseniz, öncelik 0 olarak istediğiniz kadar iş çalıştırabiliyordunuz; daha önemli bir iş kaynağa ihtiyaç duyarsa ilk öldürülenler bunlar oluyordu
Gece boyunca çalışan pek çok MapReduce deneyi yaptık ve bir süre iç servisleri de öncelik 0'da çalıştırarak fiilen “ücretsiz” gibi işlettik
Kullanım arttıkça bu tür servisler giderek daha kararsız hale geldi ve sonunda ya kaynak kullanımını gerekçelendirmek ya da ölçeğini küçültmek gerekti, ama bence bu doğru yöndü
Yapay zeka token kullanımı için de benzer bir model iyi olabilir. Büyük teknoloji şirketleri kendi LLM veri merkezlerine sahip olup iç talebi karşıladıktan sonra, mesai dışındaki atıl kapasiteyi çalışan deneylerine açabilir
Günlük işlerde teşvik edilmesi gereken şey token sayısının kendisinden çok token verimliliği olmalı. Her hafta insan emeğinden birkaç saati azaltan otomasyon için çok token harcamak iyi bir kullanımdır; elle düzeltilebilecek basit bir frontend bug'ını ayıklamak için çok token harcayıp yine de 4 saat uğraşmak ise israftır
- Bu, OpenAI'ın batch processing özelliğine benzemiyor mu? İstekler 24 saat içinde işleniyor ve maliyet yarıya iniyor
  https://developers.openai.com/api/docs/guides/batch
- LLM kullanıcılarının bu kadar mantıklı davranacağını sanmıyorum. Epey fazla kullanıcı, en ufak işler için bile mutlaka Opus kullanılması gerektiğinde ısrar ediyor gibi görünüyor
- Çoğu AI frontend'i etkileşimli işler için tasarlanmış durumda; bu da ne zaman biterse bitsin sorun olmayan öncelik 0 işleri tanımlamayı zorlaştırıyor
  Spesifikasyon odaklı geliştirme gibi, insanın döngünün içinde sürekli yer almak yerine döngünün üstünden doğrulama yaptığı yaklaşımlarda bu yöntem çok daha doğal; ama en azından Google frontend deneyimimde bunun hâlâ iyi desteklendiğini görmedim
- Basit bir frontend bug'ı için çok token harcayıp yine de 4 saat geçirmenin önüne geçmek... bunun kolay olacağını sanmıyorum
  Şu anda olan biten pek çok kişi için çok barizdi. Kasten bağımlı hale gelmesi istenerek tasarlanmış yeni bağımlılara “biraz daha dikkatli tüketin” demeye benziyor; o yüzden pek işe yaramayabilir
- Sonunda herkesin 10 kat daha ucuz Çin modellerini kabul etmeye yönelmesi daha olası değil mi?
AI kullanmayı sevmiyorum ve çok yardımcı olduğunu da düşünmüyorum
Ama şirket kullanımı dayatıyor ve metrikleri takip ediyor, ben de her gün anlamsız angaryaları üzerine atıp kullanmış gibi görünüyorum
Sorun çözdüğünden çok sorun üretiyor olsa bile, metriklerde AI kullanan kişi olarak görünüyorsun
Herhangi bir şirketin token tüketimini çalışan performans sinyali olarak kullandığını duyurması bence o şirketten uzak durmak için güçlü bir kırmızı bayraktır
İyi mühendislik liderliğine sahip bir şirket bunu makul bir fikir gibi ele almamalı
- İş seyahatinde yemek masrafı limitini 100 dolar aşarsan yöneticiyle ya da finans ekibiyle rahatsız edici bir konuşma yapman gerekir
  Ama üretken olmayan şekilde 500 dolarlık AI token harcarsan şirkette en üst düzey AI benimseyen kişi olarak görülürsün diye alay ediyoruz
- Şaşırabilirsiniz ama FAANG olmasa da herkesin bildiği büyük teknoloji şirketlerinde çalışan birkaç geliştirici tanıyorum ve hepsinde bir tür token lider tablosu var
  Hatta bazı şirketler geliştiricilere “artık tek bir satır kodu bile kendiniz yazmamanızı istiyoruz” diyor
  Yönetici bakış açısından mantık muhtemelen şu: çalışanların en üst %20'si LLM'lerle kodun %80'ini üretebiliyor ve şirket hâlâ ayakta kalıyorsa, alt %80'lik geliştirici grubunu azaltıp maliyet düşürülebilir
- Eskiden makul liderliğe sahip olan şirketler bile LLM AI ortaya çıktıktan sonra aceleci ve şüpheli kararlar almaya başladı
  Çalışan performans değerlendirmesinde token kullanımını esas almak bunlardan yalnızca biri
- Token'lar, mühendis başına kod satırı metriğinin yeni hali. Grafiğe dökmek kolay, “yönetmesi” de kolay
- Meta bunu yapıyor. Yakın zamandaki işten çıkarmalarda ölçütlerden birinin ne olduğunu tahmin edebilirsiniz
Gökyüzündeki dev füzyon reaktörünün altında gerçekten yeni olan pek az şey var
James Gleick'in “The Information” kitabında telgraf endüstrisinin tokenmaxxing benzeri bir durumunu okumuştum
Telgraflar karakter başına ücretlendirildiği için, iletilen karakter sayısını azaltan kod kitapları için büyük bir pazar vardı. Sıkıştırma doğrudan para demekti ve telgraf şirketleri bundan hoşlanmasa da kabullenmek zorunda kaldı
Telgraf kodu endüstrisi, telgrafın ticarileşmesinin ilk dönemlerinden 1920'lere kadar sürdü
Ama bunun da bir bedeli vardı. Kodlar fazlalığı ciddi biçimde azalttı ve çok küçük hatalar büyük yanlış anlamalara yol açtı
Gleick'in anlattığı gibi bu, Afrika davul geleneğinde ritim ile davulun taklit ettiği dil arasındaki ilişkiyi güçlendirmek için fazlalığın artırılmasıyla tam ters yöndeydi
- Bu tokenmaxxing'in tam tersi değil mi? Telgraf benzetmesi yapılacaksa, telgraf memurlarının müşteri verimiyle değil gün boyunca telgraf hattını ne kadar süre meşgul ettikleriyle değerlendirilmesi gerekirdi
  Yani en çok token yakan ya da en çok maliyet çıkaran kişinin kazandığı bir durum olurdu; özellik teslim eden programcılar üzerinden değil
  Anlattığınız şey token maksimize etmekten çok token minimizasyonuna yakın
- İlginç ama tokenmaxxing, token kullanım verimliliğini maksimize etmek değil, kullanım miktarının kendisini maksimize etmektir
- Anlatılan şey aslında tokenmaxxing'in tersi
LLM’lerden önce de yazılım yığını hakkında hep merak ettiğim bir şey vardı; şimdi daha da ilgili görünüyor
Uber gibi bir şirket ne zaman “tamamlanmış” olur? 16 yıldır yazılım geliştiriyorlar
Sürücüleri ve yolcuları eşleştiren bir şirket ve daha fazla yazılım yazmaları, benim otobüs ya da tren yerine Uber seçme olasılığımı çok artırmıyor
20 yıl sonra yazılım biter mi? 80 yıl sonra mı?
- Kod tabanının büyük kısmı yerel pazara özel entegrasyonlardan oluşuyor. Bir kısmı sistematik hale getirilebilir ama karmaşıklığın çoğu oradan geliyor
- Tarayıcılar, Android ve iOS 16 yıldan uzun süre sabit kalsaydı belki biraz daha kolay olurdu
  Değişen düzenleyici ortamı ve yeni ürünleri de unutmamak gerek. Sadece Uber Eats’in ne zaman çıktığına bakmak yeterli
  O 16 yıl içinde Covid-19 ortaya çıktı, pratik otonom sürüş gelişti ve Waymo ile ortaklık kuruldu
  Ağa bağlı, kitlelere yönelik bir uygulama, kusursuz öngörü olmadığı sürece asla “tamamlanmış” olamaz
  İç teknoloji yığını yaşayan bir organizma gibi; dışarıdan değişmiyor gibi görünen bir hizmeti sürdürmek için bile çok iş gerekiyor. Ölçekleme de başlı başına büyük iş ve ölçekleme ile bakım birbirini sürekli büyütüyor
- Uluslararası operasyonların ve optimizasyonun ne kadar karmaşık olduğunu gözden kaçırıyor gibisiniz
  Her ülkenin Uber’in ne yapıp ne yapamayacağına dair kendi yasaları var ve bunların koda dökülmesi gerekiyor
  Örneğin bazı yerlerde Uber uygulaması üzerinden fiilen taksi çağırıyorsunuz ve ücret de önceden sabitlenmiş bir tutar değil, mil başına hesaplanıyor olabilir
  Buna bir de şehir bazındaki yasalar ekleniyor. Yasaların farklı olduğu A kasabasından B kasabasına Uber’le gidiyorsanız ne yapılmalı? Avukat bunun cevabını bilir ama uygulamanın da buna uyması gerekir
  Üstelik yasalar sürekli değişiyor
  Optimizasyonun da sonu yok. Hız, maliyet, rota gibi her zaman iyileştirilecek şeyler var
  Tüketici olarak gördüğünüz kısım, bu tür hizmetlerin inşa edip işletmek zorunda olduğu karmaşıklığın çok küçük bir parçası
- Uygulanması gereken yeni teknolojiler ve teknikler her zaman var. Daha iyi algoritmalar, daha büyük dağıtımlar ve daha yüksek güvenilirlik de gerekiyor
  Neredeyse her zaman düzeltilmesi gereken hatalar da oluyor. Gerçekten çok fazla hata var
- Uber kendi otonom sürüş işini de yapmaya çalışmıyor muydu?
  Bu, devasa yatırım almış şirketlerin sorunu aynı zamanda. Uber’in değeri, bugün yaptığı işin kendisinden çok, özel araç sahipliği ya da toplu taşımayı eski bir kavram haline getireceği beklentisine dayanıyor
  Abartılı bir ifade ama yine de sanıldığı kadar da abartılı değil
Token maxxing saçma. Mümkün olduğunca çok hesaplama, bellek ve G/Ç kullanmak için verimsiz SQL/Spark işleri yazmaya benziyor
Kasıtlı olarak bolca Kartezyen çarpım, aşırı dengesiz veri kümeleri vb. eklemek gibi
Bir metrik hedef haline geldiğinde bunlar hep olur. Şirketler AI’ı mümkün olduğunca verimli kullanacak bir ortam geliştirmeli ve önce “bu iş için gerçekten agente ihtiyaç var mı?” diye sormalı
Gerekliyse hangi ajan, hangi model ve hangi muhakeme düzeyinin gerektiğine karar vermeli
Token tasarrufunu, cache hit oranını artırmayı ve bilgiyi daha az bağlamla kullanılabilir kılacak şekilde yapılandırmayı da teşvik etmeli. Bilgi grafikleri bu konuda oldukça iyi
- Anaokulu seviyesinde bir mantık. “X kullanılırsa iyi sonuçlar çıkabilir. O halde iyi sonuçları en üst düzeye çıkarmak için X’i olabildiğince çok kullanmalıyız” demek gibi
  Yarışı kazanmak için benzin istasyonunu ateşe vermeye benziyor
- Token maxxing’in var olma nedeni, yöneticilerin çalışanların değişime direndiğini düşünmesi
  Bu sadece tüm çalışanları yeni teknolojiyi denemeye teşvik etmenin ya da buna zorlamanın bir yolu
  Herkesin AI’dan yararlandığına kanaat getirildiğinde, token maxxing gibi şeyler doğal olarak sona erecektir
- Token maxxing’i savunan mantık genelde çalışanlara AI tabanlı iş akışları gibi geniş ve yeni bir alanı serbestçe keşfetme alanı açması
  Değer üretip üretmediği şüpheli birçok kullanım örneği gördüm ama maliyet inceleme kurulunun önünde savunulması zor olacak ajan türü iş akışlarıyla eski sorunları çözen ekipler de gördüm
  Token tasarrufu, cache hit oranını artırma ve daha az bağlam kullanımı için bilgi yapılandırma çalışmalarının, büyük token maxxing şirketlerinin çoğunda perde arkasında ayrı ekiplerce yürütüldüğünü anlıyorum
Şirketlerin AI destekli geliştirmeye para akıttığını anlıyorum. Ama toplam yatırım getirisi ne durumda? İddia edilen verim artışı kadar bir değer yarattı mı?
AI dalgasında gerçekten ilginç olan tek nokta bu ama neden kimsenin bunu konuşmadığını anlamıyorum
- Sanırım nedeni, bunu düzgün ölçmeyi bilen fazla insan olmaması
  Claude ile bir günde işe yaramaz ya da kötü 5 özellik de geliştirebilirsiniz, iki günde faydalı 1 özellik de geliştirebilirsiniz. Hangisi yatırım getirisi açısından daha iyi etki yapar?
  Örnek üzerinden bakınca cevap kolay gibi görünüyor ama gerçek hayatta çok daha nüanslı ve ölçmesi de çok daha zor
  Bu yüzden birçok şirket ölçmekten vazgeçip abartının peşine takılmak gibi daha basit bir seçim yapıyor gibi görünüyor
Kod incelemesi dahil düzgün işletildiğinde, AI kullanımının sürdürülebilir en yüksek artışı, uygun yetkinliğe sahip kıdemli bir mühendis için kabaca %20 diye düşünüyorum
Hiçbir mühendisin token bütçesi bunun üstüne çıkmamalı
Token maxxing yapan bir mühendisin gerçekten üretken olduğuna inanmıyorum ve buna dair hiçbir kanıt da görmedim. Hatta bunun tam tersi bile olabilir
Doğru akış ve kod tabanı bilgisi varsa, sürdürülebilir bir efor düzeyiyle bunun mümkün olduğunu bizzat hissettim
Mühendislik verimliliği için AI’ın, aynı sonucu daha hızlı ve daha ucuza veren sihirli bir düğme olarak yaygın biçimde yanlış anlaşıldığını düşünüyorum
Bu mantıkla bakınca çalışanlara token maxxing’i zorunlu kılmak istemek de doğal. Daha fazla sonucu daha hızlı ve daha ucuza alabiliyorsanız neden yapmayasınız?
Daha nüanslı bakınca durum şu. AI, yol haritasına bir miktar daha hızlı ulaşmayı sağlıyor ama geçici geliştirici kiralayıp özellik yaptırmaya benzer şekilde teknik borç da üretiyor
Ekip içinde yeni kodu gerçekten anlayan biri ortaya çıkmak zorunda değil
Aynı şekilde, junior ekip üyelerinin beceri gelişimi de daha az oluyor. Eskisi kadar beceri ve ücret farkı arbitrajı elde etmek zorlaşıyor
Ürün de karmaşıklaşabiliyor. P2 özelliklerin P2 olmasının bir nedeni var; AI yüzünden marjinal getirisi düşük özellikler bile eklenip ürünü karmaşıklaştırabiliyor
Birilerinin token maxxing’in iyi bir fikir olduğuna inanmış olması bile şok edici
AI maksimalistleri bu teknolojiyi sık sık elektriğe benzetiyor. Elektrifikasyonun ilk dönemlerinde bir CEO’nun çalışanları iş sonucu üreten elektrik kullanımlarını bulmaları için değil de elektrik tüketimini artırdıkları için ödüllendirdiğini hayal edin
O dönemde ruhsal hastalık belirtisi gösteren insanları kurumlara kapatmak yaygındı; muhtemelen sonu da böyle olurdu
- Sorun şu ki bireysel düzeyde iyi bir strateji. Kötü yönetim bunu üretkenlik sinyali olarak okuyor