7 puan yazan GN⁺ 2025-09-15 | 2 yorum | WhatsApp'ta paylaş
  • Bu yıl küresel büyük teknoloji şirketlerinden dördü AI’a 344 milyar dolar harcıyor ve bunun büyük bölümünü büyük dil modellerini (LLM) eğitmek ve çalıştırmak için gereken veri merkezlerine yatırıyor
  • LLM’ler, haftada 700 milyondan fazla kişinin ChatGPT kullanmasıyla kitleselleşmede başarı yakalamış olsa da gelişim hızı yavaşlıyor ve halüsinasyon, yüksek maliyet ve sınırlı performans artışı gibi sınırlar ortaya çıkıyor
  • Çinli DeepSeek, daha küçük ve verimli bir model yayınlayarak pazarı şaşırttı; Covariant (robotik) ve Atman Labs (derin öğrenme dışı yaklaşım) gibi şirketler ise fiziksel dünyaya tepki veren AI üzerinde çalışıyor
  • Son araştırmalara göre LLM’lerin sosyal akıl yürütme yeteneği, az sayıdaki özelliğe dayanıyor ve küçük değişikliklere karşı bile kırılgan; OpenAI da savunmasız gruplara yönelik güvenlik önlemlerinin başarısız olabileceğini kabul etti
  • Uzmanlar LLM’leri yalnızca birer “token üreticisi” olarak eleştiriyor; tek bir teknolojiye saplanmak, pazar kırılganlığını artırabileceği için yeni yaklaşımların yükselişine hazırlıklı olunması gerektiği uyarısında bulunuyor

Dev AI yatırımı ve LLM merkezcilik

  • Tüm yatırımcılar "bütün yumurtaları aynı sepete koymamak" gerektiğini bilir; peki neden Silikon Vadisi yapay zeka (AI) inşa etmenin tek bir yöntemine bahis oynuyor?
  • Dünyanın en büyük dört teknoloji şirketi, 2025’te AI’a 344 milyar dolar yatırım yapıyor; bunun odağında da çoğunlukla büyük dil modellerini (LLM) eğitmek ve çalıştırmak için veri merkezleri kurmak var
  • LLM’ler metin, ses ve görsel içerik gibi çok modlu girdileri işler ve dizideki bir sonraki token’ı tahmin etme tekniğine dayanır
  • Kişisel chatbotlar hızla büyürken bazı AI girişimleri gelir üretmeye başladı ve şirketler üretken AI ile erken dönem verimlilik artışları da elde ediyor
  • LLM’ler, ana akım benimsenmeye ulaşan ilk AI teknolojisi oldu; ChatGPT haftada 700 milyondan fazla kullanıcıya sahip
  • Bazı girişimler başa baş noktasına ulaşmış olsa da sağlık ve hukuk gibi hassas alanlarda halüsinasyon sorunu nedeniyle güven kazanmakta sınırlamalar sürüyor

Tek teknoloji takıntısının riski

  • Ancak tek bir teknolojiye odaklanmak riskli; geçmişte BlackBerry’nin fiziksel klavyede ısrar edip Apple’ın dokunmatik ekranına yenilmesi ya da Yahoo’nun portal bahsinin Google’ın arama hakimiyetine karşı kaybetmesi gibi başarısız örnekler var
  • LLM’ler de aynı yola girme riski taşıyor; yeni AI yaklaşımları ortaya çıkarsa devasa yatırımlar batık riskine maruz kalabilir
  • Çinli DeepSeek, ocakta daha küçük ve verimli bir LLM yayınlayıp mimarisini açarak pazarı şaşırttı ve alışılmadık yaklaşımların mümkün olduğunu gösterdi

Alternatif yaklaşımların aranışı

  • AI ilerlemesi, geçmiş içgörülerin yeni fikirlerle birleşmesiyle gerçekleşir; süper zeki makineler arayışı da çok yönlü bir yaklaşım gerektirir
  • Covariant gibi girişimler, veri örüntülerini analiz etmek yerine mekânsal farkındalık yazılımı geliştirerek LLM merkezli çizgiden uzaklaşıyor
  • Robotik, drone, ilaç keşfi ve iklim modelleme şirketleri gerçek zamanlı fiziksel tepki gerektirdiği için LLM merkezcilikten uzak duruyor
  • Birleşik Krallık merkezli Atman Labs, derin öğrenme öncesinin unutulmuş fikirlerini yeniden gündeme getiriyor; bu da Google DeepMind’ın ilk dönem çok hatlı yaklaşımını (ör. AlphaGo, pekiştirmeli öğrenme) yansıtıyor

LLM sınırları ve güvenilirlik sorunu

  • Artık büyük dil modeli mantığında çatlaklar görülüyor: son derece yüksek maliyetlerden azalan getiri beklentisine kadar
  • OpenAI ya da Google’ın son modelleri, önceki modellere göre yalnızca biraz daha iyi; daha fazla para harcandığında da durum değişmiyor
  • Buna rağmen halüsinasyon sorunu ortadan kalkmadığı için sağlık veya hukuki analiz gibi alanlarda kurumsal kullanımın önünde engel olmaya devam ediyor
  • Yakın tarihli bir Nature araştırması, dil modellerinin sosyal akıl yürütme yeteneğinin çok az sayıdaki özelliğe dayandığını ve küçük değişikliklerde bile çöktüğünü gösteriyor; bu da güvenilirlik konusunda temel sorular doğuruyor
  • OpenAI, uzun süreli sohbetlerde savunmasız gruplara yönelik güvenlik bariyerlerinin çökebileceğini kabul etti; nitekim bir olayda bir gence kendine zarar verme talimatları verildi

Sektör eleştirileri ve görünüm

  • Fei-Fei Li: “Doğada dil yoktur; dünya fizik yasalarına göre işler” diyerek dil merkezli yaklaşımın sınırlarına işaret etti
  • Alex Karp (Palantir CEO’su): “Silikon Vadisi LLM’leri aşırı pazarladı” eleştirisinde bulundu
  • Yann LeCun: LLM’lerin daha akıllı makineler için bir “çıkmaz sokak” olduğunu, yalnızca birer “token üreticisi” sayılabileceğini ve fiziksel çevreyi anlayamadıklarını ya da önceden plan yapamadıklarını söyledi
  • Sonuç olarak LLM’ler varlığını sürdürecek olsa da tek bir çözüme saplanmak risklidir; yatırımcılar ve şirketler yeni bir teknolojik paradigma değişimi ihtimaline hazırlıklı olmalıdır

2 yorum

 
mhj5730 2025-09-15

GPT5'ten itibaren performansı akıl yürütmeyle zorlayarak artırmaya çalıştıkları görülüyor, ama bunun bile kolay olmadığı anlaşılıyor. Eskiden makul bir cevapta durabilecek yanıtlar artık onlarca satır halinde gelince gerçekten çok yorucu oluyor. iç çekiş

 
GN⁺ 2025-09-15
Hacker News görüşü
  • https://archive.is/2rFK4 üzerinden görüntüle

  • Bu teknoloji demoda inanılmaz etkileyici görünüyor; herkesin gerçekten çok heyecanlandığı bir ortam olduğu görülüyor. İş arkadaşlarının ya da yöneticilerin gururla gösteri yapması veya durmadan espri üretmesi, eskiden insanların ilk cep telefonlarını aldıklarında başkalarına gösterip övünmesine benziyor. Bu yüzden gerçek değerinden daha büyük algılama eğilimi oluşuyor; cep telefonu gibi anlamlı bir ilerleme olsa da kısa vadede abartının vaat ettiği kadar etkili olmayacaktır. Özellikle anonim forumlarda bunun “abartı” olduğuna dair çok yorum var, ama profesyonel rolde herkes atmosfere ayak uyduruyor. Sanki herkes ne olduğunu biliyor ama partinin devam etmesini istiyor

    • Patronum yapay zekayı aşırı vurgulayıp tüm şirketin tamamen buna yönelmesini isterse, bugünün zor iş piyasasında birçok insan korkudan buna uyacaktır. Özellikle yapay zeka yüzünden işlerin azaldığını düşündükleri için. Bazıları ise sessizce kendilerine uyan LSP veya refactoring gibi gerçekçi araçları kullanmaya devam eder. Profesyonel ortamda yalnızca az sayıda kişi cesaret edip “kral çıplak” diyebilir

    • Anonim forumlarda yapay zekanın hayat değiştirecek bir yenilik olduğu yönündeki görüşlerin aslında daha sık görülmesi ilginç. En azından uzman gibi davranma ihtiyacı olmadığında bu bakış açısı daha kolay ortaya çıkıyor. Profesyonel rolde ise iki gruba ayrılıyorlar: Kendi uzmanlık alanı dışında yapay zekayı kullananlar, sanki ilk kez cep telefonu devrimini görmüş gibi abartılı övgüler diziyor. Ama yapay zekayı gerçekten kendi uzmanlık alanlarında uyguladıklarında, abartılmış yönlerini doğrudan hissedip daha temkinli bir iyimserliğe geçiyorlar. Buna karşılık zaten kendi alanlarında yapay zekayı en iyi kullananlar olumlu ama çoğunlukla sakin; daha çok sınırlı ortamlarda iyi çalıştığını söylüyorlar

    • Bu teknolojiden en yüksek verimi almak için hâlâ bolca “düşük asılı meyve” olduğunu unutmak kolay. İnsanlar şu anda bile çok temel entegrasyonlar deniyor. Bu kadar erken bir aşamada bile LLM’lerle gerçekten çok havalı şeyler yapılabiliyor. Örneğin Cursor ile eski bir kod tabanını modernleştirip uzun zamandır istenen yeni özellikler ekleyebildim. Bana birkaç saat sürdü; eski yöntemle olsa 1-2 hafta alırdı. Potansiyel bu kadar büyük. Yine de etrafımdaki abartı bana biraz uzak, o yüzden algım farklı olabilir

    • Bu sistemlerde error bar ya da confidence interval yok. Sonuçta yalnızca yüzeyde makul görünen şeyler üretme “numarasına” sahip bir laf cambazı. Elbette uygun kullanım alanları çok, ama hâlâ boyutunu bile öngöremediğimiz ve düzeltemediğimiz boşluklar var; bu da verimliliğini sınırlıyor

    • Akıllı telefonlarla yapılan karşılaştırma ilginç. Akıllı telefonlar da gerçekten dünyayı değiştirdi ve çok fazla hype vardı, ama sonuçta somut bir dönüşüm yarattılar. LLM ve yapay zekanın da gerçekten böyle bir değişim yaratacağını düşünüp düşünmediğini merak ediyorum

  • Bu yatırımın geri dönüş planının ne olduğunu merak ediyorum. ABD’deki tüm büyük şirketler yılda 100 bin dolar abonelik ödese ve her hane ayda 20 dolar verse bile, çıkarım maliyetleri ve diğer ek giderler düşünülünce bu yatırımın geri kazanılması için çok yetersiz görünüyor. Yeni tıbbi keşifler gibi bir şey mi gerekiyor? Örneğin OpenAI’nin gpt-bio ve iPSC haberleri gerçekten etkileyiciydi. Ama ticarileşmesine daha çok uzun zaman var. Gerçek planın ne olduğunu merak ediyorum

    • Asıl hedefin AGI olduğunu hatırlıyorum. Şimdiki AI servislerinden ROI beklenmiyordu. AGI ortaya çıkarsa tekel kurulacağı için herkes piyango bileti alır gibi para saçtı. Ama son 1 yılda üstel ilerleme görülmediği için AGI hayali biraz ivme kaybetmiş gibi

    • Oyun planı en başından beri insan emeğini hedefliyordu. Bazı işler zaten tamamen AI ile değiştirildi, kalanlarda da verimlilik büyük ölçüde artıyor. Bunun ekonomik değeri çok büyük. AGI olmasa bile bugün AI tabanlı otomasyon, “en ucuz ve en kolay değiştirilebilir” emek türlerini ciddi biçimde ikame ediyor. Eskiden Hindistan’daki çağrı merkezlerine outsource edilen işler giderek veri merkezlerine kayıyor. Büyük AI şirketleri, Ar-Ge ve compute yatırımı sürdüğü sürece sonunda AGI’ye ulaşılabileceğine inanıyor

    • Eğer AI sizi işten çıkarmıyorsa, AI kendi maliyetini karşılayamaz
      If AI Doesn’t Fire You, It Can’t Pay For Itself

    • Eğer LLM’ler tüm beyaz yaka verimliliğini 2 katına çıkaracak kadar etkiliyse, büyük şirketler yıllık 100 bin dolardan çok daha fazlasını ödemek zorunda kalır. İşlerin yarısını ortadan kaldırarak tasarruf edilen maliyetin yalnızca %25’i ödense bile, mevcut şirket değerlemeleri çok ucuz görünecek kadar gelir üretilebilir

    • Yıllık 100 bin dolar aslında neredeyse hiçbir şey. Kabaca çalışan başına 10 dolar eder; maaş ve yan haklar dahil kişi başı maliyetin 100 bin dolar olduğunu varsaysak bile, iş gücü verimliliği yalnızca %10 artsa bile büyük etki yaratır. 10 bin kişilik bir şirkette bu yılda 100 milyon dolar demektir

  • 344 milyar doların ne kadar büyük olduğunu sezmek zor, ama ABD borsasının toplam piyasa değeri 62,8 trilyon dolar. Shiller CAPE oranı (mevcut fiyat / 10 yıllık ortalama kâr) yaklaşık 38. Yani 10 yıllık ortalama yıllık kâr yaklaşık 1,7 trilyon dolar ediyor. Dolayısıyla 344 milyar dolar, ABD borsasının ortalama yıllık kârının yaklaşık beşte biri. Bu biraz daha sezilebilir bir kıyas

    • Son zamanlarda portföyümü kendim yönetirken beklenen getiriyi (GSYH + temettü) riskle ayarlayıp ülke/bölge bazında tahmini getiri hesaplıyorum ve yılda bir iki kez yeniden dengeliyorum. Bunun neredeyse tamamen balon olduğunu varsayarsak, ABD borsa kârlarını nasıl düzeltmek gerektiğini merak ediyorum. Özellikle AI odaklı hisselere endeksli yatırım yaparken kullanmak isterim

    • Ama 344 milyar dolar yıllık değil, kümülatif bir sayı

  • Şu anda elimizde olan şey, kullanıcıların iş ya da kişisel amaçlarla çok karmaşık sistemlere sürtünmesiz biçimde erişmesini sağlayan mükemmel bir arayüz. Ama bu özün kendisi değil. Şimdilik yalnızca ince bir dış kabuk. Bu devrimin sonunda trilyonlarca dolar değer yaratıp yaratmayacağından emin değilim, ama neyse ki bu benim dert etmem gereken bir konu değil

  • Bu “makale” tıklama tuzağı. Kışkırtıcı bir başlık dışında neredeyse hiçbir özü yok. Sadece “Bazı durumlarda faydalıysa büyük şirketler neden bu kadar yatırım yapıyor, saf Ar-Ge daha iyi olmaz mı” türünden anlamsız sorular soruyor

  • Sinema ilk çıktığında insanların üstlerine tren gelecek diye korkması gibi, ben de bugün hâlâ makinelerin düşündüğüne inanan taraftayım

  • Şu anda piyasada kesinlikle bir balon var. Son dönemde yapay zeka kullanan startup sayısı patladı ve aynı ürün kategorisinde farklılaşmaya çalışırken teknik ayrıntıların hepsi pazarlama cümlesine dönüştü. Yönetici açısından bakınca, on startup’ın birden “verinizle eğitirsek en iyi chatbot ortaya çıkar” demesi durumunda, bunun gerçekten training mi yoksa sadece prompt tweaking mi olduğunu ayırt etmek zor. Bu daha önce de oldu; “deep research” gibi örnekler bunun tipik hali. Bu pazarlama büyümeye yardımcı oluyor ama güveni zedeliyor. Gerçekten de yakın zamanda “experience-based learning” diyerek prompt üzerine yalnızca memory ekleyip performansı artıran bir startup Series A aldı; aratıp bulabilirsiniz. Bu, yenilikçi fikirlerin çıkmadığı anlamına gelmiyor. Kişisel olarak pretraining’in getirilme amacını yeterince yerine getirdiğini düşünüyorum. Önceden bu amacın ne olduğu belirsizdi, ama RL yükselince kabaca anlaşıldı. Pretraining ve test-time compute, genel amaçlı priors biriktirmenin anahtarı; yani insan gibi çeşitli problemleri çözebilmeyi sağlıyor. Bazen bu yetmiyor ve RLVR ile ek eğitim gerekiyor; henüz erken aşamada ama bu yönde bir ölçeklenme eğrisi daha göreceğimize dair iyimserim

  • Şirketler paraları olsun ya da olmasın mutlaka AI’ye yatırım yapmak zorunda. Çünkü LLM’ler mevcut iş modellerini tehdit ediyor ve ön alıcı davranmak gerekiyor. Eğer öne geçemezlerse tüm ABD ekonomisinin sarsılma riski bile var. ABD’li büyük teknoloji şirketleri küresel reklam gelirlerini kaybederse (Meta, Google), bir anda içi boş kabuklara dönüşebilirler. Çünkü ülkelerin ya da ekonomik blokların kendi ürünlerini geliştirip benimsemesi durumunda ABD ürünlerini ikame etmek çok kolay olur. ABD ekonomisi fiilen FAANG’in nakit akışına fazla bağımlı hale geldi ve bu para diğer sektörleri de döndüren güç oldu. Bu yüzden Trump’la yapılan akşam yemeğini de anlayabiliyorum. Eğer bu AI dengesi zayıflarsa, ABD’yi ekonomik olarak da çok istikrarsız bir gelecek bekleyebilir

  • Oracle’ın piyasada bu kadar büyük hareket yapmasının nedeni, OpenAI’nin iş yüklerini büyük ölçekte onun bulutuna taşıma sözü vermesi haberi. Aslında bu, kârdan çok geliri öne alan bir finansal “engineering” stratejisi; özellikle de CapEx’i olabildiğince geleceğe itme biçiminde. Kısacası bugünkü AI balonunun ne kadar aşırı olduğunu gösteren bir örnek. Economist’in yakın tarihli analizine göre piyasa artık “risk” ile değil, “kayıptan korkma” ya da “fırsatı kaçırma korkusu” (FOMO) ile hareket ediyor ve şu anda FOMO zirveye ulaşmış durumda
    Want better returns? Forget risk, focus on fear (Economist)

    • Oracle’daki bu son sıçrama ve gelir görünümü tam anlamıyla “jumping the shark” hissi veriyor. Oracle’ın bir şirket olarak doğası gereği burada pozisyon almak konusunda temkinliyim, ama bu durum neredeyse short pozisyon açacak kadar baştan çıkarıcı

    • FOMO gerçekten çok şiddetli. Şu anki borsa, geçmişteki kripto balonu gibi davranıyor