3 puan yazan GN⁺ 10 일 전 | 1 yorum | WhatsApp'ta paylaş
  • AI Index 2026, kıyaslama performansı, yatırım, kamu algısı, compute ve karbon emisyonları gibi göstergeler üzerinden yapay zekanın genel gidişatını derleyen bir rapor
  • Dikkate değer yapay zeka modellerinin lansmanları ABD ve sektör odaklı biçimde sürerken, Çin endüstriyel robot kurulumlarında belirgin üstünlük kaydetti
  • Küresel AI compute kapasitesi 2022'den bu yana her yıl 3 kattan fazla arttı ve Nvidia GPU'ları şu anda toplam kapasitenin yüzde 60'ından fazlasını oluşturuyor
  • Multimodal LLM ve agentic AI'nın benchmark performansı hızla yükseldi, ancak analog saat okuma gibi genel görevlerde düşük doğruluk sürüyor
  • 2025'te AI yatırımları 581 milyar doları aşarak rekor kırdı; istihdam etkisi, düzenlemeye güven ve kamusal benimseme ise ülkeye ve göstergeye göre büyük farklılıklar gösterdi

2026 AI Index raporu'ndan temel göstergeler

  • Stanford'un 400 sayfayı aşan AI Index 2026 raporu, benchmark skorları, yatırımlar, kamu algısı ve daha birçok açıdan yapay zekanın durumunu derliyor
  • Önde gelen AI model performansı hızlanmayı sürdürüyor; OpenAI ve Anthropic gibi büyük yapay zeka şirketleri de yılın ilerleyen dönemlerinde IPO'ya doğru ilerliyor
  • Yapay zekaya yönelik tepki de sürüyor; özellikle ABD'de yerel yönetimler yeni veri merkezi geliştirmelerine sınırlama ya da tamamen yasak getirmeye başlamış durumda
  • 2021'den 2025'e kadar önceki yıllardaki kapsamanın ardından, 2026'da yapay zekanın durumunu özetleyen eğilimler seçiliyor

AI modellerinde ABD üstünlüğü

  • ABD, son 10 yılda dikkate değer yapay zeka modellerinin lansmanına öncülük etti ve bu eğilim 2025'te de sürdü
    • Epoch AI'ye göre ABD merkezli kuruluşlar 2025'te 50 dikkate değer model yayımladı
    • Çin'in çıktısı ise arayı kapatmaya başladı
  • Dikkate değer modellerin neredeyse tamamı özel sektörden geldi
    • 2025'te özel sektörün dikkate değer model lansmanı sayısı 87 oldu
    • Akademi ve kamu kurumları dahil diğer tüm kaynakların toplamı ise 7 oldu
  • Özel sektörün payı uzun vadede büyük ölçüde arttı
    • Özel sektörün yayımladığı modeller artık dikkate değer modellerin yüzde 90'ından fazlasını oluşturuyor
    • 2015'te bu oran yüzde 50'nin altındaydı, 2003'te ise 0 idi

Çin'in robotik yaygınlaştırmadaki üstünlüğü

  • ABD şirketleri dikkate değer AI model sayısında önde olsa da, robotik yaygınlaştırmada Çin açık ara üstün
    • International Federation of Robotics verilerine göre Çin'in 2024'teki endüstriyel robot kurulum sayısı 295.000 oldu
    • Japonya yaklaşık 44.500, ABD ise 34.200 kurulum gerçekleştirdi

Küresel AI compute patlaması

  • Epoch AI'nin toplam AI compute kapasitesi göstergesi, AI altyapısının genişlemesini temsil eden temel ölçüt olarak sunuluyor
  • Nvidia'nın H100e performansının referans alındığı grafikte, küresel AI compute kapasitesi 2022'den bu yana her yıl 3 kattan fazla arttı
    • 2021'in ilk izleme yılı olarak alınmasıyla toplam AI compute 30 kat arttı
  • Bu genişlemeden en çok Nvidia fayda sağladı
    • Nvidia GPU'ları şu anda küresel toplam AI compute kapasitesinin yüzde 60'ından fazlasını oluşturuyor
    • Kendi AI donanımını tasarlayan Amazon ve Google onu izliyor

AI eğitimi ve çıkarımın karbon emisyonları

  • AI eğitiminin karbon emisyonları önceki yıllarda da vurgulanmıştı ve 2026'da da endişe kaynağı olmaya devam ediyor
  • En yeni frontier büyük dil modellerinin eğitimi çok yüksek emisyonlarla ilişkilendiriliyor
    • xAI'nin Grok 4 modeli için tahmini eğitim emisyonu karbon eşdeğeri olarak 72.000 tonun üzerinde
    • OpenAI GPT-4 için 5.184 ton, Meta Llama 3.1 405B için ise 8.930 ton tahmin ediliyor
  • Ray Perrault, bu sayıların tahmin olduğunu belirterek yorumlanırken dikkatli olunması gerektiğini söylüyor
    • “These estimates should be interpreted with caution”
    • Grok için Forbes yazısı, xAI açıklamaları ve doğrulanamayan diğer kaynaklardan çıkarılan girdilere büyük ölçüde dayanıldığı için belirsizlik var
    • Epoch AI, Grok 4'ün emisyonunu bağımsız olarak yaklaşık 140.000 ton CO₂ ile daha yüksek tahmin ediyor
  • AI çıkarım emisyonları da artıyor ve modeller arasında büyük farklar var
    • En verimsiz çıkarım modelinin emisyonu, en verimli modelinkinden 10 kattan fazla
    • DeepSeek V3'ün orta uzunlukta bir prompta yanıt verirken yaklaşık 23 watt tükettiği tahmin ediliyor
    • Claude 4 Opus için bu değer yaklaşık 5 watt

LLM benchmark performansında hızlanma

  • Son 10 yılda AI model performansı çok hızlı gelişti ve grafikler bu ilerlemenin hızlandığını gösteriyor
  • Özellikle multimodal LLM'ler, yeni oluşturulan benchmark'ları neredeyse anında aşacak kadar ilerleme kaydetti
  • En keskin yükseliş agentic AI alanında görülüyor
    • Grafiğin sağındaki iki dik çizgi, otonom bilgisayar kullanımını değerlendiren OSWorld benchmark
    • Otonom kodlamayı değerlendiren yazılım mühendisliği benchmark'ı SWE-Bench Verified
  • Humanity’s Last Exam'de de performans hızla arttı
    • 2025 Stanford AI Index'te birinci olan model OpenAI o1'in doğruluk oranı yüzde 8,8 idi
    • Sonrasında doğruluk yüzde 38,3'e kadar yükseldi
    • Nisan 2026 itibarıyla en yüksek skora sahip modeller olan Anthropic Claude Opus 4.6 ve Google Gemini 3.1 Pro gibi modeller yüzde 50'nin üzerine çıktı
  • Ray Perrault, benchmark ile gerçek dünya performansı arasındaki ilişkiye dikkat çekiyor
    • “We generally lack measures of how well a system (or agent) needs to function in a particular setting”
    • Hukuki akıl yürütme benchmark'ında yüzde 75 doğruluğun bile gerçek bir hukuk bürosu işine uygunluğu göstermeyebileceğini belirtiyor

Tıpta AI araştırmaları genişliyor

  • Tıbbi araştırmalarda AI kullanımı hızla artıyor
  • AI tabanlı ilaç keşfi ile ilgili makale sayısı son 2 yılda 2 kattan fazla arttı
  • Tıbbi görüntüleri ve metni birlikte ele alan multimodal biyomedikal AI makalelerinin sayısı da 2 yıl öncesine göre 2,7 katına çıktı

Analog saat okuma sınırı

  • Bazı alanlardaki hızlı ilerlemeye rağmen, analog saat okuma ve takvim anlama gibi genel görevlerde zayıflık sürüyor
  • Multimodal LLM'lerin analog saat okuma becerisini ölçen ClockBench'te en iyi performans gösteren modelin bile başarı olasılığı ancak yarı yarıya
    • OpenAI GPT-5.4 için doğru cevap olasılığı yüzde 50
  • Modellerin çoğu bundan çok daha düşük sonuç aldı
    • Anthropic Claude Opus 4.6'nın doğruluğu yüzde 8,9
    • Aynı modelin Humanity’s Last Exam'de en yüksek düzeyde skor elde ettiği de ayrıca belirtiliyor
  • Ray Perrault bunu daha genel bir sorunla ilişkilendiriyor
    • Dil, görüntü ve ses tonu gibi farklı modalitelerin birleşimini soran görevlerde bile dil bileşeni beklenenden daha büyük pay alıyor
    • Bunun, dil dışı bilginin neredeyse tamamen göz ardı edilmesine kadar varabildiğini öne süren araştırma çizgilerine değiniyor

2025'te AI yatırımı rekor kırdı

  • AI model performansındaki yükselişe paralel olarak AI yatırımları da arttı
  • AI analiz şirketi Quid verilerine göre 2025'te AI yatırımı 581 milyar doların üzerine çıkarak rekor kırdı
    • Bu rakam, 2024'teki 253 milyar doların iki katından fazla
    • Önceki zirve olan 2021'deki 360 milyar doları da açık farkla geçti
  • 2021'den farklı olarak 2025 rekoruna birleşme ve satın almalar değil, AI şirketlerine yönelik özel yatırımlar öncülük etti
  • Yatırımın büyük kısmı ABD'ye aktı
    • Geçen yıl ABD'deki AI yatırımı 344 milyar doların üzerine çıktı

Yazılım mühendislerinin AI odağı

  • GitHub'daki AI ile ilgili projelerin sayısı 2025'e kadar 5,58 milyona fırladı
    • Bu, 2020'ye göre yaklaşık 5 kat artış demek
    • 2024'e göre ise yüzde 23,7 artış
  • Bu artış sadece AI ile üretilmiş proje seli gibi görünmüyor
    • 10'dan fazla yıldız alan proje sayısı da benzer hızda arttı
    • Tüm AI projelerinin aldığı toplam yıldız sayısı da benzer tempoda yükseldi
    • Bu da insan katılımına işaret ediyor
  • Öne çıkan popüler örnek olarak açık kaynak agentic AI yazılımı OpenClaw gösteriliyor
    • GitHub'da 352.000 stars elde etti
  • Ray Perrault, AI botlarının ya da ajan projelerinin bu heyecana kısmen katkı sağlamış olabileceğini kabul ediyor
    • “probably the intensity of GitHub use is highly correlated with the intensity of AI use”
    • Stanford raporunda anılmayan etkinlik izleme sitesi Agents in the Wild verilerine göre GitHub etkinliğinin büyük bölümünün hâlâ insanlar tarafından yürütüldüğünü belirtiyor
  • Bilgisayar bilimi makalelerinde de AI ilgisi güçlü
    • AI ile ilgili bilgisayar bilimi makaleleri son 10 yılda 102.000'den 258.000'e çıkarak 2 kattan fazla arttı
    • 2024 itibarıyla bunların yüzde 68'inden fazlası akademi kaynaklı
    • Kamu ve özel sektör payı sırasıyla yaklaşık yüzde 11,5 ve yüzde 12,5
    • Büyümeye machine learning, computer vision ve generative AI alanları öncülük etti

AI'nin istihdam üzerindeki etkisinde belirsizlik

  • Generative AI'nın yaygınlaşmasıyla birlikte iş güvencesi kaygısı arttı, ancak mevcut veriler karmaşık bir tablo sunuyor
  • AI tarafından ikame edilme riski yüksek görülen software developers ve customer support agents için yaş gruplarına göre normalize edilmiş çalışan sayısı grafikleri sunuluyor
    • Giriş seviyesi işler azaldı
    • Orta ve kıdemli pozisyonlar ise korundu ya da arttı
  • Bu değişimi daha geniş ekonomik eğilimlerden bağımsız yorumlamak zor
    • Raporda birçok meslek grubunda işsizlik oranının yükseldiği belirtiliyor
    • Beklentinin aksine, AI maruziyeti en düşük çalışanlardaki işsizlik artışı, AI maruziyeti en yüksek çalışanlardan daha büyük oldu

AI'ye yönelik kamu algısında değişim

  • Ipsos anketinde AI'ye yönelik iyimserlik son birkaç yılda küçük ama dikkat çekici biçimde arttı
    • “benefits outweigh the drawbacks” yanıtı 2024'te yüzde 55 iken yüzde 59'a çıktı
    • AI'yi “good understanding” düzeyinde anladığını söyleyenlerin oranı yüzde 67'den yüzde 68'e hafif yükseldi
  • Benzer sorularda da genel kabul olumsuzdan çok olumlu tarafta, ancak bazı olumsuz duygular da arttı
    • Katılımcıların yüzde 52'si AI kullanan ürün ve hizmetlerin kendilerini “nervous” hissettirdiğini söyledi
  • Ülkeler arasında büyük farklar var
    • Çin ile birlikte Malaysia, Thailand, Indonesia ve Singapore'un da dahil olduğu Güneydoğu Asya ülkeleri daha olumlu bir çizgide
    • Yıllık bazda en büyük olumlu dönüşüm Germany yüzde 12, France yüzde 10, the Netherlands yüzde 10 olarak görüldü
    • Colombia, eksi yüzde 6 ile en büyük olumsuz dönüşümü kaydetti

AI düzenlemesine güven ülkeden ülkeye değişiyor

  • AI'nin olumlu etkisine dair algı artarken, bazı ülkelerde devlet düzenlemesine güven konusunda derin bir güvensizlik de eşlik ediyor
  • Özellikle ABD, AI yatırımında lider olmasına rağmen düzenlemeye güven sıralamasında en altlarda yer alıyor
    • Ipsos anketinde hükümetin AI'yi düzenlemesine güvendiğini söyleyen ABD'li katılımcıların oranı yüzde 31
  • Birçok Avrupa ülkesi ve Japonya'da da güven düzeyi düşük
  • Asya ve Güney Amerika ülkeleri, hükümetlerin AI'yi düzenleme kapasitesine en fazla güvenen ülkeler arasında
  • ABD ile Colombia arasındaki karşıtlık dikkat çekici
    • ABD'de AI düzenlemesine yönelik derin güvensizlik olsa da, katılımcıların çoğu AI faydalarının dezavantajlardan ağır basacağını düşünüyor
    • Colombia'da ise AI düzenlemesine güven yüksek, ancak AI'ye yönelik genel duygu kötüleşmiş durumda
  • 2025'teki AI anlatısının küçük bir özeti gibi, model performansının niteliği ile toplumsal etkiye dair algı görev ve soruya göre büyük ölçüde değişiyor

1 yorum

 
GN⁺ 10 일 전
Hacker News yorumları
  • Genç kuşağın yapay zekaya bakışının sanıldığından o kadar da parlak olmadığını belirtmek isterim. Gallup araştırmasına bakınca şüpheciliğin oldukça belirgin olduğu görülüyor

    • Ben bunu, yapay zekanın doğal sınırlarının yavaş yavaş fark edilmesi süreci olarak görüyorum
    • Bence bu hava geçici. Tarihteki her yeni teknoloji dönüşümünde olduğu gibi, sonunda herkes uyum sağlayıp kullanım biçimlerini bulacaktır
  • En yeni frontier LLM'lerden birini eğitmenin 72 bin tondan fazla karbon salımı oluşturduğu söylense bile, bunu dünya genelindeki yıllık 38 milyar tonla karşılaştırınca görece küçük olduğunu düşünüyorum

    • Bence tek bir LLM'in eğitim emisyonunun 17 bin kişinin yıllık emisyonuna denk gelmesi hiç de önemsiz değil. Yazıya göre geçen yıla kıyasla 8 kat artmış durumda ve yaklaşık 2 kat eksik tahmin edilmiş olma ihtimali de var. Üstelik donanım, eğitim verisi toplama botları, prompt işleme gibi genel kullanım kalemleri buna dahil değil; böyle büyük modellerden birden fazla var, küçük modeller ise on binlerce. Bu yıl yapay zekanın toplam emisyonunun 80 milyon ton CO2e'yi aşacağı tahmini, Austria ya da Israel gibi ülkelerin toplamından daha büyük; yani kesinlikle hafife alınacak bir şey değil
    • Buna şöyle de bakılabilir diye düşünüyorum. Tek bir modeli eğitmek 72 bin ton tutuyor ve o modeli 100 milyon kişi kullanıyorsa kişi başına 0.00072 ton düşüyor. Yazıya göre ortalama bir insanın yıllık emisyonu 5 tonun üzerinde, Amerikalılarda ise yaklaşık 18 ton; dolayısıyla buna 0.00072 eklenmesinin hissedilir bir fark yaratmadığını düşünüyorum. Elbette çıkarım maliyeti ayrı
    • xAI'ın gereksiz yere karbon yoğunluğunu artırmış gibi göründüğünü hesaba katsam bile, bu rakamın pratikte ihmal edilebilir olduğunu düşünüyorum. Ayrıca 2025'in öne çıkan iki modelini seçip ikisini de Grok yapmak da biraz komik hissettiriyor; çünkü o yılın en az yararlı, en az kullanılan ve en az ilgi çekici modellerinden birini öne çıkarmış oluyorsun
  • Sonuçta kimsenin bir hendek moat sahibi olamayacağını düşünüyorum; bu yüzden bana daha çok yatırımcıların yanılgısını büyüten grafikler gibi geliyor

    • Bence hendekler kesinlikle oluşur. Bütçeyi token kalitesine yoğunlaştırabilirsin ya da daha az sayıda ama daha iyi token kullanabilirsin. Buna kullanıcı tabanı ve etkileşim de eklenince, yeni girenlerin yetişmesini zorlaştıran bir flywheel ortaya çıkar. Pazar karmaşık; fazla basitleştirince çok şey gözden kaçıyor
    • Sermaye ve momentumun kendisinin de bir hendek olduğunu düşünüyorum. Çin modellerinin distillation kullandığı doğru ama şimdilik sıfırdan büyük ölçekli model eğittiklerini çok görmedik. Yine de çipler ucuzlar ve Çin yapımı çipler yaygınlaşırsa tablo değişebilir
  • China'nın robotik alanındaki liderliği de dikkat çekici ama benim gözüme ilk çarpan şey Grok emisyonu grafiği oldu

    • Yazıdaki "bu tahmin dikkatle yorumlanmalı ve Grok için kamuya açık haberlere dayanarak çıkarılan girdilere büyük ölçüde bağlıdır" ifadesine bakınca, o grafiğin güvenilirlik açısından biraz şüpheli göründüğünü düşünüyorum
  • GitHub proje oluşturma sayısının artmış olması, "yazılım mühendisleri yapay zekaya tamamen yöneldi" demek için epey komik geliyor. Bir repo açınca herkes yazılım mühendisi olmuyor; öyle olsaydı başka bir şey öğrenmeye de gerek kalmazdı diye düşünmeden edemiyorum

    • O göstergenin iyi olmadığına katılıyorum; onun yerine Claude Code GitHub Commits Over Time gibi bir metriğe geçmenin daha doğru olacağını düşünüyorum. Bu da kusursuz değil elbette ama en azından biraz daha az kusurlu bir gösterge ve anlamlı bir eğilimi daha iyi gösteriyor gibi geliyor
  • "China robotikte önde" kısmı yapay zekayla çok ilgili görünmüyor. China grafiği 2012'den beri neredeyse aynı çizgide gidiyor; bu yüzden o grafik yazının bağlamına pek uymuyor gibi

    • ChatGPT o zamanlar yoktu belki ama robotiği yönlendiren ML teknolojisinin kendisi o dönemde de zaten gayet çalışıyordu diye düşünüyorum
  • "Yapay zeka modeli eğitimi büyük miktarda karbon salabilir" ifadesi doğru, ama benim gerçekten görmek istediğim şey bu modellerin dünya genelinde hizmet olarak çalıştırılması sırasında ne kadar karbon çıktığını gösteren bir grafik

  • "Son 10 yılda yapay zeka modeli performansı şaşırtıcı bir hızla iyileşti ve bu ilerleme hızlanıyor" cümlesine katılmakta zorlanıyorum. Bana göre neredeyse tüm alanlar şimdiden bir plato dönemine giriyor. Yarışma matematiği gibi yakın zamanda başlayan alanlarda bu daha az belirgin olabilir ama geçmişteki grafik örüntülerine bakınca onların da sonunda benzer biçimde duraklaması olası görünüyor

  • Hâlâ State of AI in 2026 ifadesini tam olarak anlayabilmiş değilim

  • Bu yazı bir mükerrer gönderi gibi görünüyor. Asıl gönderi bu başlıkta, kaynak ise Stanford HAI'nin 2026 AI Index Report'u