12 puan yazan GN⁺ 2025-08-22 | 1 yorum | WhatsApp'ta paylaş
  • MIT raporuna göre dünya genelindeki şirketlerin %95’i, üretken AI kullanımından somut bir getiri elde edemedi
  • Şirketler ChatGPT, Copilot gibi büyük dil modellerini geniş ölçekte denedi, ancak kullanımın büyük bölümü verimlilik artışıyla sınırlı kaldı
  • Başarı örnekleri yalnızca entegre AI pilotlarının %5’inde görüldü ve bunların çoğu da satışlar ya da kâr üzerinde etkili olmadı
  • Bunun başlıca nedenleri arasında, üretken AI’nın gerçek iş süreçleriyle iyi örtüşmemesi, geri bildirimi hatırlayamaması ve bağlama uyum sağlayamaması yer alıyor
  • Rapor, büyük ölçekli iş gücü ikamesi endişelerini reddederken, dış maliyetleri azaltmanın mümkün olduğunu; ancak iç yapının yeniden düzenlenmesi ya da kitlesel işten çıkarmaların şimdilik gerçekçi görünmediğini belirtiyor
  • Sonuç olarak AI’nın bir stratejiden çok belirli görevlerde güçlü olduğu, bu nedenle şirketlerin şirket geneline yayılan dönüşüm yerine sınırlı ve anında sonuç alınabilecek alanlara odaklanması gerektiği tavsiye ediliyor

Şirketlerin üretken AI yatırımı ve getirisi

  • Son 3 yılda şirketler üretken AI projelerine 30 ila 40 milyar dolar yatırım yaptı
  • Ancak somut ticari getiri elde eden şirket sayısı son derece az
  • MIT’nin yeni araştırmasına göre, şirketlerin %95’i AI kullanımına rağmen ölçülebilir bir fayda görmediğini söyledi
  • Yalnızca AI pilot projelerinin %5’i milyonlarca dolar düzeyinde değer üretiyor

Büyük dil modeli kullanımının durumu ve sınırları

  • Büyük şirketlerin %80’inden fazlası ChatGPT, Copilot gibi başlıca LLM’leri test ediyor ya da pilot olarak kullanıyor
  • Yaklaşık şirketlerin %40’ı bu sistemleri belli ölçüde kullanıma aldı, ancak bu kullanım çoğunlukla çalışanların bireysel verimliliğini artırmakla sınırlı kaldı
  • Bunun toplam şirket geliri ya da kârlılıkta iyileşmeye neredeyse hiç etkisi olmadı

Üretken AI’nın teknik sınırlamaları

  • Üretken AI araçları çoğu zaman gerçek iş süreçleriyle iyi uyum sağlamıyor
    • Öne çıkan sorunlar arasında istikrarsız iş akışları, bağlam öğreniminin olmaması ve verimsiz iş entegrasyonu gösteriliyor
  • Çoğu üretken AI modeli geçmiş geri bildirimi koruyamıyor; bağlamlar ve işler arasında edinilen dersleri aktarmakta zorlanıyor
  • Rapora göre GenAI sistemlerinin çoğu geri bildirimi koruyamıyor, bağlama uyum sağlayamıyor ve uzun vadeli iyileşme sunamıyor
  • Bu özellikler nedeniyle şirket içindeki uzun vadeli entegrasyon maliyeti yükselirken, somut verimlilik kazanımı yetersiz kalıyor

İş dünyasının beklentileri ile gerçekler arasındaki fark

  • Üretken AI’ya yönelik beklenti ve yatırım büyüktü, ancak bu durum maliyet azaltımı ya da somut gelir yaratımına dönüşmedi
  • Gerçekte AI, müşteri hizmetleri, pazarlama, belge yazımı gibi sınırlı görevlerde kullanılıyor; zaman kazandırsa da doğrudan gelir artışı etkisi düşük kalıyor

İstihdam ve organizasyon yapısına etkisi

  • Üretken AI’nın kısa vadede büyük ölçekli iş kaybına yol açacağı yönündeki endişelerin dayanağı zayıf
  • AI etkisinin, şirket içi iş gücü yapısındaki değişimden çok dış kaynak maliyetlerinin düşürülmesi gibi dış maliyet optimizasyonuyla sınırlı kalması bekleniyor
  • Yani doğrudan büyük ölçekli personel ikamesinden ziyade outsourcing maliyetlerini azaltma düzeyinde bir etki öngörülüyor

Teknolojiye dair yanlış kanılar ve gelişim sınırları

  • Şirketler, AI’nın gerçek kapasitesini ve sınırlarını doğru anlayamadıkları için çok sayıda başarısızlık örneği ortaya çıktı
  • Üretken AI metin ya da kodu hızlıca üretebiliyor, ancak insan benzeri sürekli öğrenme ya da esneklikten yoksun
  • Örneğin çalışanlar önceki hatalara ya da yeni taleplere göre esnek biçimde uyum sağlayabilirken, AI’da böyle bir süreklilik içeren hafıza aktarımı mümkün değil

Yatırım ve gelecek yönelimi

  • Yatırımcılar ve yöneticiler AI teknolojisinin sürekli gelişmesini bekliyor, ancak kısa vadede ilerleme beklenenden daha yavaş
  • Rapor, her sektör ve her iş akışına AI’yı hemen entegre etmenin erken olduğunu gösteriyor
  • Kurumların, anında ve ölçülebilir etki yaratabilecek dar alanlarda kullanıma odaklanması gerekiyor
    • Örn: müşteri destek otomasyonu, geliştirme destek araçları, belge taslağı hazırlama gibi
  • Şirket geneline yayılan AI entegrasyonu hâlâ yüksek risk taşıyor ve başarısızlık olasılığı yüksek

Sonuç ve çıkarımlar

  • Üretken AI’nın şirketler için değer üretmesi yalnızca birkaç başarı örneğiyle sınırlı
  • Şirketlerin çoğu yalnızca günlük işlerde sınırlı bir fayda görüyor
  • Rapor, şirketlerin üretken AI’yı kapsamlı bir büyüme motoru değil, sınırlı bir araç olarak görmesi gerektiğini vurguluyor
  • Beklentiler yüksek olsa da, mevcut sistemler insanlar gibi uyum sağlayamadığı sürece şirketlerin AI’dan büyük kazanç elde etmesi zor görünüyor

1 yorum

 
GN⁺ 2025-08-22
Hacker News görüşleri
  • Bu hafta yinelenen bir tartışma vardı (162 yorum) https://news.ycombinator.com/item?id=44941118. İlgili haberde bağlanmayan gerçek kaynak rapor ise şu: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf
  • Bu raporun haber içeriğinden tamamen farklı şeyler söylediği belirtiliyor; birkaç bilgi paylaşılıyor: Başarısız bütçelerin %50’si pazarlama ve satışta kullanılmış, yapay zekanın 2,3 trilyon dolarlık emek değerini otomatikleştirebileceği, 39 milyon pozisyonu etkileyeceği ve başarısızlığın başlıca nedenlerinin yeni araçların benimsenmesine direnç ile yönetim desteği eksikliği olduğu vurgulanıyor. Yapay zekanın işe yaramadığı sonucuna fazla aceleyle varıldığını düşünüyorum; raporun söylediği bu değil.
    • “Yapay zeka 2,3 trilyon dolarlık emek değerini otomatikleştiriyor, 39 milyon pozisyonu etkiliyor” deniyor ama şu anda ABD’de emek değerinin otomasyon potansiyeli %2,27. ABD GSYİH’si şu anda 27 trilyon dolar; bu durumda ABD’de 61 milyar dolarlık emek değerini optimize ederken iş gücünün yaklaşık %15’ini ikame edip 2,3 trilyon dolarlık değer üreteceği söyleniyor. Bunun hesabının gerçekten tutup tutmadığı şüpheli. Bütün bunları kimin satın alacağı da merak konusu (işçiler değilse kim?). 2025 yapay zeka yatırımları şimdiden bunun yarısını geçmiş durumda. Bu durumda “emek değeri”ni nasıl ölçmek gerektiğini bilmiyorum; GSYİH uygun bir gösterge gibi durmuyor.
    • Benim izlenimim de raporla uyumlu. Bazı haberler sırf tıklama almak için kışkırtıcı bir anlatıyı zorluyor ve gerçek raporun içeriğini ciddi biçimde yanlış anlıyor. Mesele yapay zekanın başarısızlığı değil; daha büyük neden, çalışanların araçları iyi benimsememesi ya da en azından şirketin sunduğu araçları benimsememesi. Söz ettikleri “gölge yapay zeka ekonomisi” de gerçek bir sorun. İnsanlar şirketin sunduğu araçlar yerine kişisel abonelikli LLM’leri kullanıyor. Bizim üniversite de tüm öğrenci ve personele ChatGPT Enterprise verdi ama bu, bulut tabanlı en güncel sürümlere (ör. GPT-5) kıyasla çok yetersiz kalıyor. Bu yüzden sistem benimseme ve kullanıcıyı elde tutma oranı düşük. Kullanım senaryolarının çoğunda bulut kullanımı yasadışı olmayan veriler söz konusu olduğundan kısıtlar da çok fazla değil.
    • Rapordaki şu kısım özellikle etkileyiciydi: Orta ölçekli bir hukuk bürosunda bir avukat, şirket içinde 50 bin dolara bir sözleşme analizi aracı satın almış ama fiilî iş akışında hâlâ ChatGPT kullanıyor. Şirketin aldığı yapay zeka aracı özetlerde fazla katı ve özelleştirmesi zor; buna karşılık ChatGPT ile konuşmayı yönlendirip istenen sonucu yinelemeli biçimde elde etmek mümkün. Yani 20 dolarlık araç, gerçek kullanıcı memnuniyeti açısından milyonlarca liralık kurumsal çözümden çok daha iyi olabiliyor; paradoks burada. Bu yüzden birçok şirketin GenAI ayrımının yanlış tarafında kaldığı anlatılıyor.
    • 39 milyon pozisyonun etkilenmesi gerçekten çarpıcı bir sayı. ABD’de çalışan nüfus 163 milyon; bu, neredeyse dörtte birinin risk altında olduğu anlamına geliyor.
    • “Birçok insan yapay zekanın işe yaramadığı sonucuna çok hızlı varıyor” yorumuna karşılık, “Bir insanın maaşı bir şeyi anlamamasına bağlıysa, onu anlamaya çalışmaz” şeklindeki ünlü söz paylaşılıyor.
  • Ben şu anda bir AI engineering ekibinin lideriyim; dolayısıyla yapay zekanın değer ürettiği fikri doğal olarak benim anlayışıma uyuyor. Şirketimizde yapay zeka benimsenmesi sayesinde milyonlarca dolar tasarruf edebildik. Büyük bir çağrı merkezi işletiyoruz ve eskiden çalışanlar her çağrı için 3-5 dakika elle özet yazıyordu. Yakın zamanda çağrı özetlerini yapay zekayla otomatikleştirdik. Özet kalitesi de daha iyi oldu ve insanlar daha değerli işlere odaklanabilir hâle geldi. Devrimsel değil ama somut biçimde ölçülebilen bir verimlilik artışı.
    • Küçük bir ipucu: Özetleri baştan yazmak yerine, yalnızca gerçekten ihtiyaç olduğunda oluşturmayı önermişler. Çağrı sesini 24Kb/s Opus ile saklarsanız dakikada 180KB ediyor; belli bir süre saklayıp sonra silen bir süreçle yılda ilave milyonlarca dolar tasarruf edilebilir.
    • Bizim şirket Google Meet ve Gemini ile toplantı içeriklerinden transkript üretiyor. Ama gerçek içerik çok hatalı oluyor. Kimin konuştuğu karışıyor, bazen anlamı tersine çeviriyor. Bağlam yok ve şirket içi terminolojiyi de anlamıyor; pratikte kullanılamayacak kadar kötü.
    • Çağrı merkezi çalışanlarının yapay zeka özetlerinin gerçekten kendilerinden daha iyi olduğunu düşünüp düşünmediğini merak ediyorum. Benim durumumda toplantı özetlerinde kullanmak zor olurdu diye düşünüyorum. Sanki bu daha çok tek yönlü çağrılarda iyi çalışıyor gibi.
    • Biz de toplantı özetleri için yapay zeka kullandık ama sonuçlar o kadar zayıftı ki tekrar insanlar yazmaya başladı. İşe yarayan somut örnekler ya da eğitim/özelleştirme olup olmadığını merak ediyorum.
    • Bir çağrı merkezi çalışanının neden her çağrı için 3-5 dakikasını özet yazmaya harcaması gerektiğini de sorguluyorum. Birçok yapay zeka kullanım örneğinde aslında gereksiz işleri otomatikleştirdiklerini görüyorum. Raporu zaten kimse okumuyorsa özetin kalitesi sorun değildir; yapay zeka yanlış yazsa da fark etmez. Operasyonel verimlilikte önemli olan gereksiz süreci otomatikleştirmek değil, ortadan kaldırmaktır. Sonuçta yapay zeka çoğu zaman kurumun israf edilmiş işlerini örtüyor gibi. Böyle bir optimizasyon mümkün değilse, o zaman buna yine ihtiyaç olabilir.
  • Şimdi “hayal kırıklığı çukuru”na (Trough of disillusionment) girilen dönem. Bu tür abartı döngüleri öngörülebilir. GPT-5’in büyük beklentiler sonunda hayal kırıklığı yarattığı yönünde yorumlar gelirken, bu GenAI için “artık bitti” anı olabilir. ROI sorulmaya başladığında gerçekler ortaya çıkar. Zeki olanlar şimdiden sonraki dönüşüme hazırlanıyor ve bazıları hâlâ bu çukurun dibine kadar inmeyi bekliyor. Gittikçe daha da umutsuzlaşan PR, “gerçekten değer var” diye bastıracak.
    • Çoğu şirketin bunun para israfı olduğunu bildiği hâlde, hisse fiyatı nedeniyle mecburen yatırım yaptığını öğrensem şaşırmam.
    • Gemini her güncellemede epey iyi bir izlenim veriyor ama son dönemde iyileşme hızı ve içeriğin kalitesi açısından ciddi biçimde yavaşladı. Bu, duvara yaklaşmanın bir işareti gibi. Bir durgunluk döneminden sonra yeniden sıçrama yaşanan modelde, LLM’lerin bilgisayarlı görüye kıyasla daha iyi bir geleceği olacağını düşünüyorum.
    • Sam Altman GPT-5’in performansını fazla abarttı. Kullanıcı açısından GPT-4’e kıyasla büyük bir sıçrama hissedilmiyor. Ama eğitilebilir dinamik yönlendirici yaklaşımının çıkarım maliyetini ciddi biçimde düşürmesi önemli. Bu, kullanıcıdan çok OpenAI ve elektrik şebekesi için faydalı bir yenilik.
    • OpenAI GPT-3.5-Turbo’dan GPT-4’e geçerken bu devrim niteliğindeydi ve ortada başka model de yoktu. Ama GPT-5 çıkmadan önce bile o serisi, Llama, DeepSeek, Gemini gibi sayısız model ortaya çıktı. Bundan sonra GPT-3.5’ten 4’e geçişteki gibi sıçramalar olmayacak. GPT-5 birçok modeli tek bir modelde birleştiriyor ama “ilk” unvanına sahip değil.
    • Acaba Windsurf ekibinin erken çıkış yapıp ayrılmasının sebebi de bu muydu?
  • Gerçekten gelir yaratan ya da maliyet düşüren pratik yapay zeka kullanım örneklerinin neler olduğu soruluyor. 1. Çevrimiçi içerik üretimi (zaten aşırı doymuş) 2. junior geliştiricilerin yerine geçme (verimlilik artışı sınırlı) 3. müşteri hizmetleri çalışanlarının yerini alma (maliyet düşüşü sağlar ama gelire etkisi az) 4. yardımcı araçlar (yazma, analiz vb., ama sınırlı) 5. video oyunları/robot karakterler gibi yeni nesil etkileşim 6. AI sanal sevgili ve NSFW; bu pazarın bir süre daha kârlı kalabileceği düşünülüyor. Daha gerçekçi örnek olup olmadığı soruluyor.
    • Ben LLM’leri yarı yapılandırılmış belgelerden belirli bilgileri çıkarıp otomatik sınıflandırma/dosyalama yapan bir projede kullanıyorum; doğruluk %95’in üzerinde ve henüz fine-tuning bile yapmadım. Son aşamada yine manuel onay olacak ama şimdiden yılda yüzlerce saat tasarruf sağlıyor. Bilgi çıkarma ve sınıflandırmada yapay zeka çok etkili.
    • Sağlıkta muayene notları, veri ve görüntüleme yorumları dâhil tüm kayıtlar doğrudan gelirle bağlantılı. Her yıl bu alandaki idari maliyetlere on milyarlarca dolar harcanıyor. GenAI ile not kalitesi/doğruluğu ciddi biçimde artarsa bu doğrudan gelir artışına dönüşebilir. Sigortada da durum benzer; muazzam miktarda belge işi ve doğrulama gerekiyor. Sonunda AI’lar birbirine sadece belge gönderip insanlar havuz başında oturabilir.
    • AI müşteri hizmetleri, kullanıcı açısından sinir bozucu bir deneyim.
    • Ayda 200 dolara %50 verimlilik artışı çok büyük bir değer. Çoğu ülkede yıllık verimlilik artışı %0-2 aralığında.
    • Şirket içi belgeleri/wiki’yi/codebase’i RAG ile bir araya getirip onboarding ve bilgi aramayı kolaylaştıran bir yapay zeka olmasını isterdim. İnsanın yerine geçmektense çalışmayı kolaylaştıran yollar aramak daha doğru.
  • İnsanların yaptığı en büyük hata, yapay zekaya bir hizmet değil bir özellik olarak bakmak gerektiği. Kimse “Bugün yapay zekayla konuşmak istiyorum!” diye düşünmez. Kullanıcılar sadece işleri çok sıkıcı ya da çok bunaltıcı olmadan düzgünce bitirmek ister; böyle anlarda yapay zekanın sessizce yardım etmesi gerekir. Ama sattığımız şey özellik değil hizmet (=ürün) olduğundan, pazarlamada yapay zekayı öne çıkarmak kaçınılmaz oluyor. Notion/Slack/Airtable gibi herkes AI’ı başlığa taşıyor ama özünde mesele AI değil, onun yardımcı olduğu işin kendisi.
    • Ben “AI bir özelliktir” de demiyorum; AI sonuçta bir teknoloji. İnsanların arzusu “Keşke bu üründe AI olsa” değil, “Keşke bu işi yapabilsem” şeklinde. Ürün benim işimi çözüyorsa hangi yöntemle yaptığı önemli değil. Çok fazla şirket AI’ın kendisini kolayca ürüne eklemeye çalışıyor ama kullanıcıların çözmek istediği probleme odaklanmıyor.
    • Söylenen doğru ama gerçekte bu olursa piyasanın yüksek değerlemeleri ve aşırı ısınmış havası dağılır. Böyle bir ayılma anı geldiğinde, kalan “sıcak” yazılım alanları da sönmeye başlayacak ve sektör genel olarak artık 5-10 yıl önceki pazar olmadığını kabullenecek.
    • AI’ın sadece bir başka araç olarak sunulması güzel olurdu. “Böyle bir kullanım senaryosu var” diyen tek seferlik bir açılır pencere yeterli. Gerçekte ise her arayüz AI logosu, autocomplete vb. ile dolduruluyor ve bu da odaklanmayı bozuyor. Araç olmaktan çıkıp başrole yerleşmiş gibi. Oysa kullanıcıya ihtiyacına göre kullanması için rehberlik etmek yeterli olurdu; şu an fazla zorla dayatılıyor hissi veriyor. Bu şirketlerin biraz durup kullanıcıya alan bırakmayı öğrenmesi lazım.
    • Buna içtenlikle katılıyorum; sonuçta önemli olan ürünün kendisinin değeri, altında ne kullanıldığı değil.
    • Bu günlerde AI uygulamaları neredeyse “çözüm arayan problem” gibi görünüyor.
  • Rapor PDF bağlantısı bir landing page’e yönlendiriyor ve CTA olarak “AI ürün başarısını daha hızlı yakalayın” deniyor; bu yüzden nesnel bir rapordan çok sıradan bir content marketing çalışmasına benziyor. Yazarın adına tıkladım ama hiçbir şey çıkmadı. Ne siteye ne yazara güven veriyor. HN de artık Reddit gibi, insanlar başlığı görüp gelip sadece katılıp katılmadığını yorum olarak bırakıyor.
  • İnsanlar gerçekten raporu kendileri okusaydı ne düşünürdü merak ediyorum: https://mlq.ai/media/quarterly_decks/v0.1_State_of_AI_in_Business_2025_Report.pdf. Şirketlerin yalnızca %40’ında resmi LLM aboneliği var ama şirket çalışanlarının %90’ından fazlası işte günlük olarak kişisel AI araçları kullanıyor. Pratikte neredeyse tüm çalışanlar bir şekilde LLM kullanıyor. “Gölge AI” kullanıcıları, şirketin resmi projeleri pilot aşamada takılı kalmışken bile her gün birçok kez LLM’lerden yararlanıyor. Kurumların resmi AI girişimleri başarısız olurken, aslında şirketlerin içinde LLM kullanımı yayılıyor; paradoks bu. Bu hikâye haberdeki gibi yeni bir bomba değil, hatta tamamen farklı bir şey bile olabilir.
  • Görünüşe göre ABD her teknoloji dalgasında hep öne geçiyor. Çok para harcayıp kaybediyor da ama riski alıyor ve sonuçta başkalarının yetişemeyeceği kadar ilerliyor. AI/ABD şirketlerine karşı çok erken zafer ilan etmek tehlikeli olabilir.
    • ABD’nin her alanda önde olduğunu genellemek zor bence. Finans gibi birçok alanda başka ülkelerin gerisinde. Çin elektrikli araçlar ve güneşte önde. Yazılım tarafı doğru olabilir ama ABD’nin savunma hattı daha çok tekelcilik, lock-in ve zenginlere göre tasarlanmış düzenlemelerden oluşuyor.
    • Bu düşünce tarzı fazla basit; gerçeği tersine çarpıtabilir.
    • Güneş enerjisi, elektrikli araçlar, drone’lar gibi örneklerle ABD’nin her zaman önde sayılamayacağı söyleniyor.
    • GSM tarihine de değinilerek, inovasyonu her zaman ABD’nin sürüklemediği görüşü dile getiriliyor.
  • Kişinin kendi verimliliğine dair öz değerlendirmesinin gerçek durumdan farklı olabilmesi ilginç. METR’nin araştırmasında geliştiriciler AI sayesinde %20 hızlandıklarını hissetti ama gerçekte %19 yavaşladılar. https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/
    • Bu tür çalışmaların da yakalaması zor çok fazla nüans var. Kullanılan AI türü, kullanılan araçlar, aşinalık düzeyi, geliştirme süreci, ekip büyüklüğü ve kullanıcının kıdemiyle ne kadar ayrıntıcı olduğu gibi birçok unsur sonucu etkiliyor. Şu anda yatırımcılar pazar payı kazanmak için AI fiyatlarını büyük ölçüde sübvanse ediyor ama bu bittikten sonra fiyatların daha da düşebileceğini düşünüyorum. Ben AI’daki ilerlemeler sayesinde şimdiden yeterince kazanç sağladığımı düşünüyorum; bundan sonra odak daha çok kademeli iyileşme ve kullanıcı deneyimi olacak gibi. Şu an AI şirketlerine yatırım yapmayı düşünmüyorum.
    • Bazen AI sanki autocomplete gibi düşüncemi kusursuzca okuyormuş gibi geliyor ama bazen de tamamen saçma önerilerle sadece ayak bağı oluyor.
    • AI’ın insanları daha çok ayrıntıların içinde (“in the weeds”) iyileştirmelere odaklayıp büyük resmi kaçırmasına yol açıp açmayacağı da düşündürüyor. Geliştirme hızı aslında daha çok stratejik kararlarla belirleniyor: Bu aracı kullanmalı mıyım, bu özellik gerçekten gerekli mi vb.
    • Örneklem küçük olsa da, anekdotlardan ya da öz bildirim verilerinden çok daha anlamlı bir araştırma.