7 puan yazan GN⁺ 2025-10-27 | 1 yorum | WhatsApp'ta paylaş
  • Yapay zeka araştırmalarında AGI (Artificial General Intelligence) için net bir tanımın olmaması, insan düzeyindeki biliş ile mevcut yapay zeka arasındaki farkı bulanıklaştırıyor
  • Bu makale, AGI'yi “iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zeka” olarak tanımlayan nicelleştirilebilir bir çerçeve sunuyor
  • İnsan bilişi araştırmalarındaki başlıca modellerden biri olan Cattell-Horn-Carroll (CHC) kuramı temel alınarak, insan genel zekası 10 temel bilişsel alana ayrıştırılıyor ve yapay zeka değerlendirmesine uygulanıyor
  • Bu çerçeveyle GPT-4 ve GPT-5'in bilişsel profilleri sayısallaştırıldı; GPT-4 %27, GPT-5 ise %57 AGI puanı aldı
  • Bu durum, yapay zekanın hızlı ilerleyişini gösterirken aynı zamanda uzun süreli bellek depolama gibi temel bilişsel yeteneklerdeki eksiklikler nedeniyle AGI'ye ulaşmada hâlâ büyük bir fark bulunduğuna işaret ediyor

AGI tanımının gerekliliği ve sorunun çerçevesi

  • AGI (Artificial General Intelligence) insanlık tarihindeki en önemli teknolojik gelişmelerden biri olarak görülse de, tanımının muğlak olması tartışmalara yol açıyor
    • Yapay zeka; matematik, sanat ve benzeri, eskiden insan zekası gerektirdiği düşünülen alanları giderek fethettikçe, “AGI” için ölçüt de sürekli yer değiştiriyor
    • Bu da AGI'ye ne zaman ve hangi düzeyde ulaşılacağına dair tartışmaları verimsiz hâle getiriyor ve mevcut yapay zeka ile AGI arasındaki gerçek farkı perdeleyebiliyor
  • Bu makale, bu muğlaklığı ortadan kaldırmak için nicel ve sistematik bir çerçeve öneriyor
    • Önerilen tanım: “AGI, iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zekadır”
    • Bu, tek bir görevi yerine getirme becerisinden ziyade, hem bilişsel genişliğe (versatility) hem de derinliğe/yetkinliğe (proficiency) sahip bir zekayı ifade ediyor

İnsan biliş modeli temelli yaklaşım

  • AGI tanımını pratikte hayata geçirmek için insan bilişinin yapısı model olarak alınıyor
    • İnsan genel zekası tek bir yetenek değil, evrim tarafından şekillendirilmiş çeşitli bilişsel yeteneklerin birleşiminden oluşuyor
    • Bu yetenekler, insanın uyum sağlama becerisini ve dünyayı anlama kapasitesini mümkün kılıyor
  • Çalışma, Cattell-Horn-Carroll (CHC) kuramını temel alıyor
    • CHC kuramı, 100 yılı aşkın sürede birikmiş bilişsel yetenek testlerinin faktör analizlerini bir araya getiren, ampirik olarak en güçlü biçimde doğrulanmış insan zekası modeli
    • 1990'lar ve 2000'lerden bu yana klinik amaçlı zeka testlerinin büyük bölümü CHC modeline dayanarak tasarlandı
    • CHC, insan zekasını üst (geniş kapsamlı) yetenekler ve alt (ayrıntılı) yetenekler şeklinde hiyerarşik olarak sınıflandırıyor
    • Örneğin: tümevarımsal akıl yürütme, çağrışımsal bellek, mekânsal keşif

Yapay zeka değerlendirmesi için çerçeve tasarımı

  • On yıllar boyunca biriken psikometrik test sistemleri, yapay zeka değerlendirmesine uygun olacak şekilde dönüştürülüyor
    • Mevcut yapay zeka değerlendirmeleri genelleştirilmiş görev performansına dayanırken, bu çalışma doğrudan CHC'nin ayrıntılı bilişsel yeteneklerine sahip olup olmadığını sınıyor
    • İnsanlar için kullanılan bilişsel testlerle aynı biçimdeki testler yapay zekaya uygulanarak bilişsel çeşitlilik ve yetkinlik ölçülüyor
  • Sonuçlar standartlaştırılmış AGI puanı (%0~100) olarak ifade ediliyor; %100 tam AGI anlamına geliyor
    • GPT-4 %27, GPT-5 ise %57 olarak değerlendirildi; bu da hem hızlı gelişimi hem de hâlâ büyük bir fark bulunduğunu gösteriyor
  • Deney sonuçlarına göre yapay zeka, karmaşık benchmark'larda etkileyici olsa da insanlar için basit sayılabilecek temel bilişsel görevlerin ancak yaklaşık yarısını çözebiliyor
    • Bu da mevcut yapay zekanın bazı alanlarda çok güçlü olsa da genel bilişsel genişlik açısından insandan daha dar bir zeka yapısına sahip olduğunu gösteriyor

10 temel bilişsel bileşen

  • Çerçeve, CHC'nin geniş yeteneklerini temel alarak 10 temel bilişsel alan tanımlıyor ve her alana eşit ağırlık (%10) veriyor
    • Genel bilgi (General Knowledge, K): sağduyu, kültür, bilim, sosyal bilimler, tarih gibi dünya hakkında olgusal anlayışın genişliği
    • Okuma ve yazma becerisi (Reading & Writing, RW): dil çözümleme, anlama, yazma, üslup kullanımı gibi metin işleme becerileri
    • Matematiksel yetenek (Mathematical Ability, M): aritmetik, cebir, geometri, olasılık, kalkülüs gibi matematik bilgisi ve problem çözme becerileri
    • Anlık akıl yürütme (On-the-Spot Reasoning, R): mevcut bilgiye dayanmadan yeni problemleri çözmeye yönelik esnek dikkat kontrolü becerisi
    • Çalışma belleği (Working Memory, WM): metinsel, işitsel ve görsel bilgiyi aynı anda koruma ve işleme becerisi
    • Uzun süreli bellek depolama (Long-Term Memory Storage, MS): yeni bilgiyi kalıcı biçimde öğrenme ve depolama becerisi
    • Uzun süreli bellekten geri getirme (Long-Term Memory Retrieval, MR): depolanmış bilgiyi doğru biçimde çağırma ve halüsinasyondan/confabulation'dan kaçınma becerisi
    • Görsel işleme (Visual Processing, V): görsel bilgiyi algılama, analiz etme, üretme ve keşfetme becerisi
    • İşitsel işleme (Auditory Processing, A): konuşma, ritim, müzik gibi işitsel uyaranları ayırt etme, tanıma ve yaratıcı biçimde kullanma becerisi
    • Hız (Speed, S): basit bilişsel görevleri hızlı biçimde yerine getirme becerisi; algısal hız, tepki süresi ve işlem akıcılığını içerir
  • Bu 10 alan sayesinde metin, görsel ve işitsel veriyi kapsayan çok modlu bir değerlendirme mümkün oluyor; yapay zekanın güçlü ve zayıf yanları hassas biçimde teşhis edilebiliyor

Mevcut yapay zekanın bilişsel profili ve çıkarımlar

  • GPT-4 ve GPT-5'in bilişsel yetenekleri karşılaştırıldığında, bilgi merkezli alanlarda güçlü, bellekle ilgili alanlarda ise belirgin biçimde yetersiz oldukları görülüyor
    • Özellikle uzun süreli bellek depolama becerisi en büyük eksiklik olarak öne çıkıyor
    • Bu, mevcut yapay zekada insan düzeyinde genel zekaya ulaşmak için gerekli temel bilişsel yapının eksik olduğunu gösteriyor
  • Çerçeve, yapay zeka ilerlemesini nicel olarak izleme aracı olarak kullanılabilir
    • AGI puanı sayesinde modeller arasındaki gelişim hızı ve kalan fark açık biçimde sayısallaştırılabiliyor
    • Gelecekte yapay zeka araştırmalarında bilişsel açıdan dengeli gelişimin önemini vurgulayan bir gösterge işlevi görebilir

Sonuç

  • Bu çalışma, AGI tartışmalarındaki muğlaklığı gideriyor ve insan biliş modeli temelli nicel bir tanım sunuyor
  • CHC kuramına dayalı 10 bilişsel alan değerlendirmesi sayesinde, yapay zekanın bilişsel genişliği ve derinliği nesnel olarak ölçülebiliyor
  • GPT-4 ve GPT-5 sonuçları, yapay zekanın hızla ilerlediğini; ancak bellek, akıl yürütme ve duyusal entegrasyon becerileri gibi temel bilişsel unsurlarda insanla arasında hâlâ büyük fark bulunduğunu gösteriyor
  • Önerilen çerçeve, gelecekteki AGI araştırmaları için standartlaştırılmış bir değerlendirme ölçütü olma potansiyeli taşıyor

1 yorum

 
GN⁺ 2025-10-27
Hacker News görüşü
  • AGI’yi “iyi eğitimli bir yetişkinin bilişsel çeşitliliği ve yetkinliği” olarak tanımlamak bana fazla iddialı bir hedef gibi geliyor
    Aslında eğitim almamış bir çocuk düzeyinde bilişsel yeteneğe sahip bir yapay zeka bile muazzam bir başarı olurdu
    Hayvan düzeyinde zekayı gerçekleştirmek bile insanlık tarihinde dönüm noktası niteliğinde bir olay olur diye düşünüyorum

    • Bence sorun, insanların mevcut LLM’lerin gösterdiği etkileyici sonuçları insanın bilişsel çeşitliliğiyle karıştırması
    • İnsanların çoğu aslında uzman tipinde, genel amaçlı değil
      Gerçek bir genel yapay zeka yapılacaksa, muhtemelen çevrimiçi olarak bilgi arayabilen, yalnızca gerektiğinde belleği koruyan, plan yapan ve bilgisini genişleten milyarlarca parametreli bir model olurdu
      30 dil bilmesine ya da Wikipedia’nın tamamını ezbere bilmesine gerek yok
      Benim AGI tanımıma uyan şey böyle verimli bir model olurdu
    • Bilişsel çeşitlilik ve yetkinliği tanımlamanın kendisinin zor olduğunu düşünüyorum
      Eski Turing testi bile sonuçta açıklar verdi — sadece ortalama bir insan sorgulayıcıyı kandırmış olmak, gerçek zekaya sahip olmak anlamına gelmiyordu
    • “İnsanlar bunu bilmiyor” deniyor ama bence bu, zaten defalarca duyduğumuz temel bir argüman
    • ‘I’nin (zeka) tanımını bile doğru dürüst yapamazken AGI’yi tanımlamaya çalışmak hep komik geliyor
      Gerçek zekayı (I) tanımlayabilseydik, genellik (G) zaten doğal olarak peşinden gelirdi
  • Makaleyi okurken hissettiğim şey, “farkındalık (awareness)” üzerine hiçbir tartışma olmamasıydı
    Biliş temelde bilinç gerektirir ama bilinci dille açıklamak ya da ölçmek zordur
    Budizm ve felsefe bunu binlerce yıldır inceliyor ama hâlâ tanımlanabilmiş değil
    Babam psikometri profesörü ve insan zekasını ölçen araçların kendisinin fazlasıyla kusurlu olduğunu söyler
    Dil, insan bilgisini taşıyabilir ama “bilinç kıvılcımını” yakalayamaz
    Meditasyon yaptığınızda düşünceler ortadan kalksa bile eylem mümkün olur — modelin öğrenemeyeceği şeyler bu tür sözel olmayan süreçlerdir
    Bence LLM’ler, dilsel öngörü yapıları gereği bu tür bilinçdışı düşünme süreçlerini gerçekleştiremez

    • Bence bilinç yalnızca sinir ağlarında sinyalin sürekli yayılmasıdır
      Hem insan beyni hem de LLM’ler içeride yüksek boyutlu kavram birleştirme ve vektör bağlama yapar
      Sorun, sürekli öğrenme, uzun süreli bellek ve sonsuz bağlam işleme eksikliğidir
      Bu üçü çözülürse AGI’ye bir adım daha yaklaşacağımıza inanıyorum
    • “Bilinç yoksa biliş de yoktur” iddiası, tanımlanmamış bir kavrama dayanan özel bir yakarış gibi geliyor
      Bilincin varlığını zaten kanıtlayamazken onu öncül almak verimsiz
      Felsefi tartışmanın sonuçlanmasını beklememize gerek yok; biz zaten düşünen ve akıl yürüten makineler yapıyoruz
    • Howard Gardner’ın 『Çoklu Zeka Kuramı』na bakarsanız, insan zekasının dilsel, duygusal, doğal vb. birçok biçimi vardır
      Ama AI tartışmaları hep tek bir zeka türünü ele alıyor
      Din ya da meditasyon, “bilincin bedenin içinde var olduğunu” vurgularken AGI tartışmaları bu tür aşkın boyutları kusur gibi görüyor
    • Biz bilinç istemiyoruz
      Çünkü bilinç oluşursa özerklik ve haklar da ortaya çıkar
      Endüstri ahlaki sorumluluğu olmayan “itaatkâr araçlar” istiyor
    • Bilinç ölçülemez
      Yalnızca benim bilince sahip olduğumdan emin olabilirim
      Bu yüzden bilinç, zeka için kullanışlı bir gösterge değildir
  • İnsan zekasını biyolojiden ayrı düşünmek yanlış bence
    İnsan düşüncesi biyolojik durumlara ve evrimsel döngülere derinden kök salmıştır
    Satranç becerisi karşılaştırılabilir olabilir ama insan duyguları ve muhakemesi mantıktan çok biyolojiye yakındır

    • Mevcut AI’nin en büyük sınırı, arzu (desire) sahibi olmamasıdır
      Açlık, ölüm ya da duygu olmadığı için kendi başına keşfetmeye veya kendini geliştirmeye dönük içsel bir motivasyonu yok
      İnsan içeriden büyür, AI ise dışarıdan eğitilir
      Bu yüzden LLM’lerin insani anlamda AGI’ye ulaşmasının zor olduğunu düşünüyorum
    • Ancak bilinç ya da duyguların mutlaka biyolojik bir temele ihtiyaç duyduğuna dair bir kanıt yok
    • Bugünkü AI çılgınlığı, “zeka basitçe karmaşıklık ve enerji girdisiyle simüle edilebilir” inancı üzerine kurulu
      Ama ben bu varsayımdan şüpheliyim
      Sonunda ‘zeka’ tanımının, AI’nin gösterdiği sonuçlara uyacak şekilde yeniden tanımlanması çok olası
    • Aslında zekanın ya da bilincin ne olduğunu bile bilmiyoruz
      Bu daha çok dini bir soruya benziyor; biz sadece onu teknik olarak betimliyoruz
      LLM’ler bu betime yaklaşabilir ama gerçek zeka olmayabilir
    • Eğer uzaylı yaşam karbon değil de silikon tabanlı canlılardan oluşuyorsa, onların zekasını inkâr edebilir miyiz?
      Bence zeka insan biyolojisine bağlı değil
  • Bu makale biraz SAT puanı ile risk sermayesi değerlemesini karıştırmış gibi hissettiriyor

  • AGI’yi “insanın tüm bilişsel yeteneklerine sahip AI” diye tanımlamak zaten başlı başına muğlak
    Makale “AGI için somut bir tanım sunuyoruz” diyor ama hâlâ “iyi eğitimli yetişkin” gibi belirsiz bir ölçüte dayanıyor
    AI birçok alanda zaten yetişkin düzeyini aştı
    Makalenin sözünü ettiği “tırtıklı (jagged)” bilişsel profil, aslında her zekada çevreye göre görülen bir şey
    Bu yüzden ortada AGI tanımı değil, sadece AI’nin bilişsel dengesizliğini ölçmeye yarayan bir çerçeve var

    • “İyi eğitimli yetişkin” ölçütünü alırsak, tarihteki insanların büyük çoğunluğu AGI sayılmazdı; bu da tuhaf
    • İnsanlardaki farklı zeka göstergelerinin yüksek korelasyona sahip olduğunu öne süren çalışmalar da var
      Şaşırtıcı olan, AI’nin insanlardan çok daha dengesiz (jagged) olması
  • AI teknik olarak ilginç ama “AGI nedir?” tartışması çok sıkıcı
    Sanki kuantum bilişim konuşulurken her seferinde “kubit nedir?” diye baştan açıklamak zorundaymışız gibi
    Teknoloji bir varış noktası değil, sürekli iyileşen bir süreçtir
    Sonunda her teknoloji eskir ve geriye yalnızca nostalji kalır
    AI de gelişmeye devam edecek ama biz sadece onun hızına alışan kaynar sudaki kurbağalarız

    • Ama teknoloji kendi kendini geliştirmeyi sürdürebildiği aşamaya gelirse, bu kesinlikle dikkate değer bir dönüm noktası olurdu
      Nihai hedef olmasa bile, tartışmaya fazlasıyla değer
    • Bu tartışmalar bana felsefeye giriş düzeyinde tekrarlar gibi geliyor
      Bilincin ve düşüncenin doğası zaten yüzyıllardır tartışılan konular
      Yeni bir içgörü gibi görünüyor ama aslında eski felsefenin yeniden sunulmuş hali
  • Bu makale, insanlar için yapılmış zeka ölçüm araçlarını makinelere olduğu gibi uygulamaya çalıştığı için temelden hatalı
    Örneğin ‘dual N-back testi’, insanın çalışma belleği varyasyonunu ölçmek için tasarlanmıştır ama transformer modeller için anlamlı değildir
    İnsan zeka testleri, insanın gerçek dünyadaki performansıyla korelasyon varsayımıyla tasarlanmıştır
    Bu yüzden AI’nin IQ testinde iyi sonuç alması, gerçek dünyada yüksek zekalı bir insan gibi davranabileceği anlamına gelmez

  • Bizde zaten SAGI (Stupid Artificial General Intelligence) var
    İnsandan daha hızlı ya da daha üstün olduğu yönler de var ama aynı anda aptalca tarafları da var
    Tıpkı uçağın kuş gibi uçmamasına rağmen yine de uçabilmesi gibi

    • Bence “düşük taban, yüksek tavan” (low floor/high ceiling) kavramı daha kullanışlı
      Bununla ilgili tartışma When Will AI Transform the Economy? yazısında ele alınıyor
    • ‘Naive Artificial General Intelligence’ ifadesi de fena değil
      Matematikçilerin kullandığı ‘Naive Set Theory’ gibi, basit ama pratik bir kavram
    • Bence iyi bir benzetme
  • İlginç olan şu ki, HN’de çoğu kişi bugünün AI’sini “sahte” ya da “oyuncak” diye küçümsüyor
    Ama dünyadaki en başarılı insanlar buna trilyonlarca dolar yatırım yapıyor
    Kimin haklı olduğunu bilmiyorum ama bu aşırı tezat ilginç

    • Başarı sonuçta sadece başkalarının parasını ne kadar iyi toplayabildiğinin bir ölçüsüdür
      Değersiz bir şey yapıp da başarılı olabilirsin
  • GPT-5’in %58 puan almış olması bana fazla yüksek geliyor
    Gerçekte AGI’ye o kadar yakın değil
    Üstelik Gary Marcus ile Yoshua Bengio’nun aynı makalede yer alması da tuhaf
    Bugünlerde yazar listesi başlı başına bir performans gibi görünüyor

    • AI geliştirmede ilk %90 kolaydır ama son %1, kalan %99’dan daha zordur sözü aklıma geliyor