1 puan yazan GN⁺ 3 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Uber’in COO’su, yapay zeka harcamalarının yapılan yatırım kadar sonuç üretip üretmediğini gerekçelendirmenin giderek zorlaştığını düşünüyor
  • Uber CTO’sunun 2026 Claude Code bütçesinin tamamının şimdiden harcandığını açıklamasının ardından şirket içindeki tartışma büyüdü
  • Daha fazla token kullanımının, faydalı tüketici özelliklerinde orantılı bir artışa yol açtığını gösteren bağlantı henüz doğrulanmış değil
  • Uber CEO’su, yapay zeka yatırımlarını dengelemek için Uber’in işe alım hızını yavaşlattığını söyledi
  • Big Tech’teki tokenmaxxing akımının aksine Duolingo, çalışan tepkisinin ardından yapay zeka kullanımını performans değerlendirmesine dahil etme kararını geri çekti

Uber içinde yapay zeka maliyetlerini gerekçelendirme sorunu

  • Uber Operasyon Direktörü Andrew Macdonald, şirket içinde yapay zeka maliyetlerini gerekçelendirmenin giderek zorlaştığını düşünüyor
  • Cumartesi günü yayımlanan Rapid Response röportajında, yapay zekanın şirketin harcadığı para kadar etki üretmediğini söyledi
  • Uber CTO’su Praveen Neppalli Naga’nın nisan ayında The Information’a verdiği röportajda Uber’in 2026 Claude Code bütçesinin tamamını şimdiden harcadığını söylemesinin ardından şirket içindeki tartışma büyüdü
  • Bu açıklama, Macdonald’ın “kafamın patlayacakmış gibi hissettiğim an” diye tarif ettiği bir duruma yol açtı ve şirket içinde AI token tüketimi ile çalışan sayısı arasındaki ödünleşim tartışılmaya başlandı

Token kullanımı ile ürün çıktıları arasındaki bağın eksikliği

  • Macdonald, Uber’in kıdemli mühendislik liderleriyle konuştuktan sonra, daha fazla token kullanımının faydalı tüketici özelliklerinde orantılı bir artışa yol açmadığı sonucuna vardı
  • “Bu bağlantı henüz yok” diyerek, daha fazla özelliğin yayınlanıyor olabileceğini ancak bunu belirli metriklerle doğrudan ilişkilendirip “artık gerçekten %25 daha fazla faydalı tüketici özelliği üretiyoruz” sonucuna varmanın zor olduğunu söyledi
  • Yapay zeka harcamalarını çıktılarla doğrudan ilişkilendirmek zorlaştıkça, bunun getirdiği ödün maliyetini gerekçelendirmek de zorlaşıyor
  • CEO Dara Khosrowshahi, bu ayın başındaki bilanço görüşmesinde Uber’in yapay zeka yatırımlarını dengelemek için işe alımı yavaşlattığını söyledi

Kullanıcıya ücretsiz gibi geliyor ama maliyeti şirket ödüyor

  • Macdonald, maliyeti kullanıcının ödemediği ve sadece “ilginç kullanım senaryoları” düşündüğü durumda yapay zekanın ücretsizmiş gibi görünebileceğini düşünüyor
  • Ancak nihayetinde maliyeti şirket ödüyor
  • Yapay zeka kullanımının genişlemesi artık yalnızca bir verimlilik deneyi değil; bütçeyi ve iş gücü planlamasını etkileyen bir maliyet yapısı olarak ele alınıyor

Big Tech’teki tokenmaxxing’den farklı bir akış

  • Big Tech, mümkün olan en yüksek düzeyde yapay zeka kullanımı anlamına gelen tokenmaxxing yaklaşımına güçlü biçimde yönelmiş durumda ve bazı şirketler çalışanların yapay zeka kullanımını değerlendirmeye katıyor
  • Meta, Google, JPMorgan, yapay zeka kullanımını performans değerlendirmeleri, hedefler, zamlar ve terfilerle ilişkilendiren şirketler arasında gösteriliyor
  • Buna karşılık bazı şirketler, yapay zeka kullanımını kendi başına zorlayan yaklaşımdan geri adım atmaya başladı
  • Duolingo, çalışanların “yapay zekayı sadece yapay zeka kullanmak için mi kullanmalıyız?” diye sormasının ardından, yapay zeka kullanımını performans değerlendirmesine dahil etme kararını geri çekti
  • Duolingo CEO’su Luis von Ahn, nisan ayındaki bir podcast röportajında bunun, gerçek sonuçlardan sorumlu tutmaktan çok bazı durumlarda uygun olmayan bir şeyi zorla dayatmak gibi hissettirdiğini söyledi

1 yorum

 
GN⁺ 3 시간 전
Hacker News yorumları
  • 2007~2009 arasında Google'ın veri merkezlerini büyük ölçüde büyüttüğü dönemde, özellikle mesai dışı saatlerde atıl kapasite çok fazlaydı
    Mühendisseniz, öncelik 0 olarak istediğiniz kadar iş çalıştırabiliyordunuz; daha önemli bir iş kaynağa ihtiyaç duyarsa ilk öldürülenler bunlar oluyordu
    Gece boyunca çalışan pek çok MapReduce deneyi yaptık ve bir süre iç servisleri de öncelik 0'da çalıştırarak fiilen “ücretsiz” gibi işlettik
    Kullanım arttıkça bu tür servisler giderek daha kararsız hale geldi ve sonunda ya kaynak kullanımını gerekçelendirmek ya da ölçeğini küçültmek gerekti, ama bence bu doğru yöndü
    Yapay zeka token kullanımı için de benzer bir model iyi olabilir. Büyük teknoloji şirketleri kendi LLM veri merkezlerine sahip olup iç talebi karşıladıktan sonra, mesai dışındaki atıl kapasiteyi çalışan deneylerine açabilir
    Günlük işlerde teşvik edilmesi gereken şey token sayısının kendisinden çok token verimliliği olmalı. Her hafta insan emeğinden birkaç saati azaltan otomasyon için çok token harcamak iyi bir kullanımdır; elle düzeltilebilecek basit bir frontend bug'ını ayıklamak için çok token harcayıp yine de 4 saat uğraşmak ise israftır

    • Bu, OpenAI'ın batch processing özelliğine benzemiyor mu? İstekler 24 saat içinde işleniyor ve maliyet yarıya iniyor
      https://developers.openai.com/api/docs/guides/batch
    • LLM kullanıcılarının bu kadar mantıklı davranacağını sanmıyorum. Epey fazla kullanıcı, en ufak işler için bile mutlaka Opus kullanılması gerektiğinde ısrar ediyor gibi görünüyor
    • Çoğu AI frontend'i etkileşimli işler için tasarlanmış durumda; bu da ne zaman biterse bitsin sorun olmayan öncelik 0 işleri tanımlamayı zorlaştırıyor
      Spesifikasyon odaklı geliştirme gibi, insanın döngünün içinde sürekli yer almak yerine döngünün üstünden doğrulama yaptığı yaklaşımlarda bu yöntem çok daha doğal; ama en azından Google frontend deneyimimde bunun hâlâ iyi desteklendiğini görmedim
    • Basit bir frontend bug'ı için çok token harcayıp yine de 4 saat geçirmenin önüne geçmek... bunun kolay olacağını sanmıyorum
      Şu anda olan biten pek çok kişi için çok barizdi. Kasten bağımlı hale gelmesi istenerek tasarlanmış yeni bağımlılara “biraz daha dikkatli tüketin” demeye benziyor; o yüzden pek işe yaramayabilir
    • Sonunda herkesin 10 kat daha ucuz Çin modellerini kabul etmeye yönelmesi daha olası değil mi?
  • AI kullanmayı sevmiyorum ve çok yardımcı olduğunu da düşünmüyorum
    Ama şirket kullanımı dayatıyor ve metrikleri takip ediyor, ben de her gün anlamsız angaryaları üzerine atıp kullanmış gibi görünüyorum
    Sorun çözdüğünden çok sorun üretiyor olsa bile, metriklerde AI kullanan kişi olarak görünüyorsun

  • Herhangi bir şirketin token tüketimini çalışan performans sinyali olarak kullandığını duyurması bence o şirketten uzak durmak için güçlü bir kırmızı bayraktır
    İyi mühendislik liderliğine sahip bir şirket bunu makul bir fikir gibi ele almamalı

    • İş seyahatinde yemek masrafı limitini 100 dolar aşarsan yöneticiyle ya da finans ekibiyle rahatsız edici bir konuşma yapman gerekir
      Ama üretken olmayan şekilde 500 dolarlık AI token harcarsan şirkette en üst düzey AI benimseyen kişi olarak görülürsün diye alay ediyoruz
    • Şaşırabilirsiniz ama FAANG olmasa da herkesin bildiği büyük teknoloji şirketlerinde çalışan birkaç geliştirici tanıyorum ve hepsinde bir tür token lider tablosu var
      Hatta bazı şirketler geliştiricilere “artık tek bir satır kodu bile kendiniz yazmamanızı istiyoruz” diyor
      Yönetici bakış açısından mantık muhtemelen şu: çalışanların en üst %20'si LLM'lerle kodun %80'ini üretebiliyor ve şirket hâlâ ayakta kalıyorsa, alt %80'lik geliştirici grubunu azaltıp maliyet düşürülebilir
    • Eskiden makul liderliğe sahip olan şirketler bile LLM AI ortaya çıktıktan sonra aceleci ve şüpheli kararlar almaya başladı
      Çalışan performans değerlendirmesinde token kullanımını esas almak bunlardan yalnızca biri
    • Token'lar, mühendis başına kod satırı metriğinin yeni hali. Grafiğe dökmek kolay, “yönetmesi” de kolay
    • Meta bunu yapıyor. Yakın zamandaki işten çıkarmalarda ölçütlerden birinin ne olduğunu tahmin edebilirsiniz
  • Gökyüzündeki dev füzyon reaktörünün altında gerçekten yeni olan pek az şey var
    James Gleick'in “The Information” kitabında telgraf endüstrisinin tokenmaxxing benzeri bir durumunu okumuştum
    Telgraflar karakter başına ücretlendirildiği için, iletilen karakter sayısını azaltan kod kitapları için büyük bir pazar vardı. Sıkıştırma doğrudan para demekti ve telgraf şirketleri bundan hoşlanmasa da kabullenmek zorunda kaldı
    Telgraf kodu endüstrisi, telgrafın ticarileşmesinin ilk dönemlerinden 1920'lere kadar sürdü
    Ama bunun da bir bedeli vardı. Kodlar fazlalığı ciddi biçimde azalttı ve çok küçük hatalar büyük yanlış anlamalara yol açtı
    Gleick'in anlattığı gibi bu, Afrika davul geleneğinde ritim ile davulun taklit ettiği dil arasındaki ilişkiyi güçlendirmek için fazlalığın artırılmasıyla tam ters yöndeydi

    • Bu tokenmaxxing'in tam tersi değil mi? Telgraf benzetmesi yapılacaksa, telgraf memurlarının müşteri verimiyle değil gün boyunca telgraf hattını ne kadar süre meşgul ettikleriyle değerlendirilmesi gerekirdi
      Yani en çok token yakan ya da en çok maliyet çıkaran kişinin kazandığı bir durum olurdu; özellik teslim eden programcılar üzerinden değil
      Anlattığınız şey token maksimize etmekten çok token minimizasyonuna yakın
    • İlginç ama tokenmaxxing, token kullanım verimliliğini maksimize etmek değil, kullanım miktarının kendisini maksimize etmektir
    • Anlatılan şey aslında tokenmaxxing'in tersi
  • LLM’lerden önce de yazılım yığını hakkında hep merak ettiğim bir şey vardı; şimdi daha da ilgili görünüyor
    Uber gibi bir şirket ne zaman “tamamlanmış” olur? 16 yıldır yazılım geliştiriyorlar
    Sürücüleri ve yolcuları eşleştiren bir şirket ve daha fazla yazılım yazmaları, benim otobüs ya da tren yerine Uber seçme olasılığımı çok artırmıyor
    20 yıl sonra yazılım biter mi? 80 yıl sonra mı?

    • Kod tabanının büyük kısmı yerel pazara özel entegrasyonlardan oluşuyor. Bir kısmı sistematik hale getirilebilir ama karmaşıklığın çoğu oradan geliyor
    • Tarayıcılar, Android ve iOS 16 yıldan uzun süre sabit kalsaydı belki biraz daha kolay olurdu
      Değişen düzenleyici ortamı ve yeni ürünleri de unutmamak gerek. Sadece Uber Eats’in ne zaman çıktığına bakmak yeterli
      O 16 yıl içinde Covid-19 ortaya çıktı, pratik otonom sürüş gelişti ve Waymo ile ortaklık kuruldu
      Ağa bağlı, kitlelere yönelik bir uygulama, kusursuz öngörü olmadığı sürece asla “tamamlanmış” olamaz
      İç teknoloji yığını yaşayan bir organizma gibi; dışarıdan değişmiyor gibi görünen bir hizmeti sürdürmek için bile çok iş gerekiyor. Ölçekleme de başlı başına büyük iş ve ölçekleme ile bakım birbirini sürekli büyütüyor
    • Uluslararası operasyonların ve optimizasyonun ne kadar karmaşık olduğunu gözden kaçırıyor gibisiniz
      Her ülkenin Uber’in ne yapıp ne yapamayacağına dair kendi yasaları var ve bunların koda dökülmesi gerekiyor
      Örneğin bazı yerlerde Uber uygulaması üzerinden fiilen taksi çağırıyorsunuz ve ücret de önceden sabitlenmiş bir tutar değil, mil başına hesaplanıyor olabilir
      Buna bir de şehir bazındaki yasalar ekleniyor. Yasaların farklı olduğu A kasabasından B kasabasına Uber’le gidiyorsanız ne yapılmalı? Avukat bunun cevabını bilir ama uygulamanın da buna uyması gerekir
      Üstelik yasalar sürekli değişiyor
      Optimizasyonun da sonu yok. Hız, maliyet, rota gibi her zaman iyileştirilecek şeyler var
      Tüketici olarak gördüğünüz kısım, bu tür hizmetlerin inşa edip işletmek zorunda olduğu karmaşıklığın çok küçük bir parçası
    • Uygulanması gereken yeni teknolojiler ve teknikler her zaman var. Daha iyi algoritmalar, daha büyük dağıtımlar ve daha yüksek güvenilirlik de gerekiyor
      Neredeyse her zaman düzeltilmesi gereken hatalar da oluyor. Gerçekten çok fazla hata var
    • Uber kendi otonom sürüş işini de yapmaya çalışmıyor muydu?
      Bu, devasa yatırım almış şirketlerin sorunu aynı zamanda. Uber’in değeri, bugün yaptığı işin kendisinden çok, özel araç sahipliği ya da toplu taşımayı eski bir kavram haline getireceği beklentisine dayanıyor
      Abartılı bir ifade ama yine de sanıldığı kadar da abartılı değil
  • Token maxxing saçma. Mümkün olduğunca çok hesaplama, bellek ve G/Ç kullanmak için verimsiz SQL/Spark işleri yazmaya benziyor
    Kasıtlı olarak bolca Kartezyen çarpım, aşırı dengesiz veri kümeleri vb. eklemek gibi
    Bir metrik hedef haline geldiğinde bunlar hep olur. Şirketler AI’ı mümkün olduğunca verimli kullanacak bir ortam geliştirmeli ve önce “bu iş için gerçekten agente ihtiyaç var mı?” diye sormalı
    Gerekliyse hangi ajan, hangi model ve hangi muhakeme düzeyinin gerektiğine karar vermeli
    Token tasarrufunu, cache hit oranını artırmayı ve bilgiyi daha az bağlamla kullanılabilir kılacak şekilde yapılandırmayı da teşvik etmeli. Bilgi grafikleri bu konuda oldukça iyi

    • Anaokulu seviyesinde bir mantık. “X kullanılırsa iyi sonuçlar çıkabilir. O halde iyi sonuçları en üst düzeye çıkarmak için X’i olabildiğince çok kullanmalıyız” demek gibi
      Yarışı kazanmak için benzin istasyonunu ateşe vermeye benziyor
    • Token maxxing’in var olma nedeni, yöneticilerin çalışanların değişime direndiğini düşünmesi
      Bu sadece tüm çalışanları yeni teknolojiyi denemeye teşvik etmenin ya da buna zorlamanın bir yolu
      Herkesin AI’dan yararlandığına kanaat getirildiğinde, token maxxing gibi şeyler doğal olarak sona erecektir
    • Token maxxing’i savunan mantık genelde çalışanlara AI tabanlı iş akışları gibi geniş ve yeni bir alanı serbestçe keşfetme alanı açması
      Değer üretip üretmediği şüpheli birçok kullanım örneği gördüm ama maliyet inceleme kurulunun önünde savunulması zor olacak ajan türü iş akışlarıyla eski sorunları çözen ekipler de gördüm
      Token tasarrufu, cache hit oranını artırma ve daha az bağlam kullanımı için bilgi yapılandırma çalışmalarının, büyük token maxxing şirketlerinin çoğunda perde arkasında ayrı ekiplerce yürütüldüğünü anlıyorum
  • Şirketlerin AI destekli geliştirmeye para akıttığını anlıyorum. Ama toplam yatırım getirisi ne durumda? İddia edilen verim artışı kadar bir değer yarattı mı?
    AI dalgasında gerçekten ilginç olan tek nokta bu ama neden kimsenin bunu konuşmadığını anlamıyorum

    • Sanırım nedeni, bunu düzgün ölçmeyi bilen fazla insan olmaması
      Claude ile bir günde işe yaramaz ya da kötü 5 özellik de geliştirebilirsiniz, iki günde faydalı 1 özellik de geliştirebilirsiniz. Hangisi yatırım getirisi açısından daha iyi etki yapar?
      Örnek üzerinden bakınca cevap kolay gibi görünüyor ama gerçek hayatta çok daha nüanslı ve ölçmesi de çok daha zor
      Bu yüzden birçok şirket ölçmekten vazgeçip abartının peşine takılmak gibi daha basit bir seçim yapıyor gibi görünüyor
  • Kod incelemesi dahil düzgün işletildiğinde, AI kullanımının sürdürülebilir en yüksek artışı, uygun yetkinliğe sahip kıdemli bir mühendis için kabaca %20 diye düşünüyorum
    Hiçbir mühendisin token bütçesi bunun üstüne çıkmamalı
    Token maxxing yapan bir mühendisin gerçekten üretken olduğuna inanmıyorum ve buna dair hiçbir kanıt da görmedim. Hatta bunun tam tersi bile olabilir
    Doğru akış ve kod tabanı bilgisi varsa, sürdürülebilir bir efor düzeyiyle bunun mümkün olduğunu bizzat hissettim

  • Mühendislik verimliliği için AI’ın, aynı sonucu daha hızlı ve daha ucuza veren sihirli bir düğme olarak yaygın biçimde yanlış anlaşıldığını düşünüyorum
    Bu mantıkla bakınca çalışanlara token maxxing’i zorunlu kılmak istemek de doğal. Daha fazla sonucu daha hızlı ve daha ucuza alabiliyorsanız neden yapmayasınız?
    Daha nüanslı bakınca durum şu. AI, yol haritasına bir miktar daha hızlı ulaşmayı sağlıyor ama geçici geliştirici kiralayıp özellik yaptırmaya benzer şekilde teknik borç da üretiyor
    Ekip içinde yeni kodu gerçekten anlayan biri ortaya çıkmak zorunda değil
    Aynı şekilde, junior ekip üyelerinin beceri gelişimi de daha az oluyor. Eskisi kadar beceri ve ücret farkı arbitrajı elde etmek zorlaşıyor
    Ürün de karmaşıklaşabiliyor. P2 özelliklerin P2 olmasının bir nedeni var; AI yüzünden marjinal getirisi düşük özellikler bile eklenip ürünü karmaşıklaştırabiliyor

  • Birilerinin token maxxing’in iyi bir fikir olduğuna inanmış olması bile şok edici
    AI maksimalistleri bu teknolojiyi sık sık elektriğe benzetiyor. Elektrifikasyonun ilk dönemlerinde bir CEO’nun çalışanları iş sonucu üreten elektrik kullanımlarını bulmaları için değil de elektrik tüketimini artırdıkları için ödüllendirdiğini hayal edin
    O dönemde ruhsal hastalık belirtisi gösteren insanları kurumlara kapatmak yaygındı; muhtemelen sonu da böyle olurdu

    • Sorun şu ki bireysel düzeyde iyi bir strateji. Kötü yönetim bunu üretkenlik sinyali olarak okuyor