AGI'nin tanımı

(arxiv.org)

7 puan yazan GN⁺ 2025-10-27 | 1 yorum | WhatsApp'ta paylaş

Yapay zeka araştırmalarında AGI (Artificial General Intelligence) için net bir tanımın olmaması, insan düzeyindeki biliş ile mevcut yapay zeka arasındaki farkı bulanıklaştırıyor
Bu makale, AGI'yi “iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zeka” olarak tanımlayan nicelleştirilebilir bir çerçeve sunuyor
İnsan bilişi araştırmalarındaki başlıca modellerden biri olan Cattell-Horn-Carroll (CHC) kuramı temel alınarak, insan genel zekası 10 temel bilişsel alana ayrıştırılıyor ve yapay zeka değerlendirmesine uygulanıyor
Bu çerçeveyle GPT-4 ve GPT-5'in bilişsel profilleri sayısallaştırıldı; GPT-4 %27, GPT-5 ise %57 AGI puanı aldı
Bu durum, yapay zekanın hızlı ilerleyişini gösterirken aynı zamanda uzun süreli bellek depolama gibi temel bilişsel yeteneklerdeki eksiklikler nedeniyle AGI'ye ulaşmada hâlâ büyük bir fark bulunduğuna işaret ediyor

AGI tanımının gerekliliği ve sorunun çerçevesi

AGI (Artificial General Intelligence) insanlık tarihindeki en önemli teknolojik gelişmelerden biri olarak görülse de, tanımının muğlak olması tartışmalara yol açıyor
- Yapay zeka; matematik, sanat ve benzeri, eskiden insan zekası gerektirdiği düşünülen alanları giderek fethettikçe, “AGI” için ölçüt de sürekli yer değiştiriyor
- Bu da AGI'ye ne zaman ve hangi düzeyde ulaşılacağına dair tartışmaları verimsiz hâle getiriyor ve mevcut yapay zeka ile AGI arasındaki gerçek farkı perdeleyebiliyor
Bu makale, bu muğlaklığı ortadan kaldırmak için nicel ve sistematik bir çerçeve öneriyor
- Önerilen tanım: “AGI, iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zekadır”
- Bu, tek bir görevi yerine getirme becerisinden ziyade, hem bilişsel genişliğe (versatility) hem de derinliğe/yetkinliğe (proficiency) sahip bir zekayı ifade ediyor

İnsan biliş modeli temelli yaklaşım

AGI tanımını pratikte hayata geçirmek için insan bilişinin yapısı model olarak alınıyor
- İnsan genel zekası tek bir yetenek değil, evrim tarafından şekillendirilmiş çeşitli bilişsel yeteneklerin birleşiminden oluşuyor
- Bu yetenekler, insanın uyum sağlama becerisini ve dünyayı anlama kapasitesini mümkün kılıyor
Çalışma, Cattell-Horn-Carroll (CHC) kuramını temel alıyor
- CHC kuramı, 100 yılı aşkın sürede birikmiş bilişsel yetenek testlerinin faktör analizlerini bir araya getiren, ampirik olarak en güçlü biçimde doğrulanmış insan zekası modeli
- 1990'lar ve 2000'lerden bu yana klinik amaçlı zeka testlerinin büyük bölümü CHC modeline dayanarak tasarlandı
- CHC, insan zekasını üst (geniş kapsamlı) yetenekler ve alt (ayrıntılı) yetenekler şeklinde hiyerarşik olarak sınıflandırıyor
- Örneğin: tümevarımsal akıl yürütme, çağrışımsal bellek, mekânsal keşif

Yapay zeka değerlendirmesi için çerçeve tasarımı

On yıllar boyunca biriken psikometrik test sistemleri, yapay zeka değerlendirmesine uygun olacak şekilde dönüştürülüyor
- Mevcut yapay zeka değerlendirmeleri genelleştirilmiş görev performansına dayanırken, bu çalışma doğrudan CHC'nin ayrıntılı bilişsel yeteneklerine sahip olup olmadığını sınıyor
- İnsanlar için kullanılan bilişsel testlerle aynı biçimdeki testler yapay zekaya uygulanarak bilişsel çeşitlilik ve yetkinlik ölçülüyor
Sonuçlar standartlaştırılmış AGI puanı (%0~100) olarak ifade ediliyor; %100 tam AGI anlamına geliyor
- GPT-4 %27, GPT-5 ise %57 olarak değerlendirildi; bu da hem hızlı gelişimi hem de hâlâ büyük bir fark bulunduğunu gösteriyor
Deney sonuçlarına göre yapay zeka, karmaşık benchmark'larda etkileyici olsa da insanlar için basit sayılabilecek temel bilişsel görevlerin ancak yaklaşık yarısını çözebiliyor
- Bu da mevcut yapay zekanın bazı alanlarda çok güçlü olsa da genel bilişsel genişlik açısından insandan daha dar bir zeka yapısına sahip olduğunu gösteriyor

10 temel bilişsel bileşen

Çerçeve, CHC'nin geniş yeteneklerini temel alarak 10 temel bilişsel alan tanımlıyor ve her alana eşit ağırlık (%10) veriyor
- Genel bilgi (General Knowledge, K): sağduyu, kültür, bilim, sosyal bilimler, tarih gibi dünya hakkında olgusal anlayışın genişliği
- Okuma ve yazma becerisi (Reading & Writing, RW): dil çözümleme, anlama, yazma, üslup kullanımı gibi metin işleme becerileri
- Matematiksel yetenek (Mathematical Ability, M): aritmetik, cebir, geometri, olasılık, kalkülüs gibi matematik bilgisi ve problem çözme becerileri
- Anlık akıl yürütme (On-the-Spot Reasoning, R): mevcut bilgiye dayanmadan yeni problemleri çözmeye yönelik esnek dikkat kontrolü becerisi
- Çalışma belleği (Working Memory, WM): metinsel, işitsel ve görsel bilgiyi aynı anda koruma ve işleme becerisi
- Uzun süreli bellek depolama (Long-Term Memory Storage, MS): yeni bilgiyi kalıcı biçimde öğrenme ve depolama becerisi
- Uzun süreli bellekten geri getirme (Long-Term Memory Retrieval, MR): depolanmış bilgiyi doğru biçimde çağırma ve halüsinasyondan/confabulation'dan kaçınma becerisi
- Görsel işleme (Visual Processing, V): görsel bilgiyi algılama, analiz etme, üretme ve keşfetme becerisi
- İşitsel işleme (Auditory Processing, A): konuşma, ritim, müzik gibi işitsel uyaranları ayırt etme, tanıma ve yaratıcı biçimde kullanma becerisi
- Hız (Speed, S): basit bilişsel görevleri hızlı biçimde yerine getirme becerisi; algısal hız, tepki süresi ve işlem akıcılığını içerir
Bu 10 alan sayesinde metin, görsel ve işitsel veriyi kapsayan çok modlu bir değerlendirme mümkün oluyor; yapay zekanın güçlü ve zayıf yanları hassas biçimde teşhis edilebiliyor

Mevcut yapay zekanın bilişsel profili ve çıkarımlar

GPT-4 ve GPT-5'in bilişsel yetenekleri karşılaştırıldığında, bilgi merkezli alanlarda güçlü, bellekle ilgili alanlarda ise belirgin biçimde yetersiz oldukları görülüyor
- Özellikle uzun süreli bellek depolama becerisi en büyük eksiklik olarak öne çıkıyor
- Bu, mevcut yapay zekada insan düzeyinde genel zekaya ulaşmak için gerekli temel bilişsel yapının eksik olduğunu gösteriyor
Çerçeve, yapay zeka ilerlemesini nicel olarak izleme aracı olarak kullanılabilir
- AGI puanı sayesinde modeller arasındaki gelişim hızı ve kalan fark açık biçimde sayısallaştırılabiliyor
- Gelecekte yapay zeka araştırmalarında bilişsel açıdan dengeli gelişimin önemini vurgulayan bir gösterge işlevi görebilir

Sonuç

Bu çalışma, AGI tartışmalarındaki muğlaklığı gideriyor ve insan biliş modeli temelli nicel bir tanım sunuyor
CHC kuramına dayalı 10 bilişsel alan değerlendirmesi sayesinde, yapay zekanın bilişsel genişliği ve derinliği nesnel olarak ölçülebiliyor
GPT-4 ve GPT-5 sonuçları, yapay zekanın hızla ilerlediğini; ancak bellek, akıl yürütme ve duyusal entegrasyon becerileri gibi temel bilişsel unsurlarda insanla arasında hâlâ büyük fark bulunduğunu gösteriyor
Önerilen çerçeve, gelecekteki AGI araştırmaları için standartlaştırılmış bir değerlendirme ölçütü olma potansiyeli taşıyor

1 yorum

GN⁺ 2025-10-27

Hacker News görüşü

AGI’yi “iyi eğitimli bir yetişkinin bilişsel çeşitliliği ve yetkinliği” olarak tanımlamak bana fazla iddialı bir hedef gibi geliyor
Aslında eğitim almamış bir çocuk düzeyinde bilişsel yeteneğe sahip bir yapay zeka bile muazzam bir başarı olurdu
Hayvan düzeyinde zekayı gerçekleştirmek bile insanlık tarihinde dönüm noktası niteliğinde bir olay olur diye düşünüyorum
- Bence sorun, insanların mevcut LLM’lerin gösterdiği etkileyici sonuçları insanın bilişsel çeşitliliğiyle karıştırması
- İnsanların çoğu aslında uzman tipinde, genel amaçlı değil
  Gerçek bir genel yapay zeka yapılacaksa, muhtemelen çevrimiçi olarak bilgi arayabilen, yalnızca gerektiğinde belleği koruyan, plan yapan ve bilgisini genişleten milyarlarca parametreli bir model olurdu
  30 dil bilmesine ya da Wikipedia’nın tamamını ezbere bilmesine gerek yok
  Benim AGI tanımıma uyan şey böyle verimli bir model olurdu
- Bilişsel çeşitlilik ve yetkinliği tanımlamanın kendisinin zor olduğunu düşünüyorum
  Eski Turing testi bile sonuçta açıklar verdi — sadece ortalama bir insan sorgulayıcıyı kandırmış olmak, gerçek zekaya sahip olmak anlamına gelmiyordu
- “İnsanlar bunu bilmiyor” deniyor ama bence bu, zaten defalarca duyduğumuz temel bir argüman
- ‘I’nin (zeka) tanımını bile doğru dürüst yapamazken AGI’yi tanımlamaya çalışmak hep komik geliyor
  Gerçek zekayı (I) tanımlayabilseydik, genellik (G) zaten doğal olarak peşinden gelirdi
Makaleyi okurken hissettiğim şey, “farkındalık (awareness)” üzerine hiçbir tartışma olmamasıydı
Biliş temelde bilinç gerektirir ama bilinci dille açıklamak ya da ölçmek zordur
Budizm ve felsefe bunu binlerce yıldır inceliyor ama hâlâ tanımlanabilmiş değil
Babam psikometri profesörü ve insan zekasını ölçen araçların kendisinin fazlasıyla kusurlu olduğunu söyler
Dil, insan bilgisini taşıyabilir ama “bilinç kıvılcımını” yakalayamaz
Meditasyon yaptığınızda düşünceler ortadan kalksa bile eylem mümkün olur — modelin öğrenemeyeceği şeyler bu tür sözel olmayan süreçlerdir
Bence LLM’ler, dilsel öngörü yapıları gereği bu tür bilinçdışı düşünme süreçlerini gerçekleştiremez
- Bence bilinç yalnızca sinir ağlarında sinyalin sürekli yayılmasıdır
  Hem insan beyni hem de LLM’ler içeride yüksek boyutlu kavram birleştirme ve vektör bağlama yapar
  Sorun, sürekli öğrenme, uzun süreli bellek ve sonsuz bağlam işleme eksikliğidir
  Bu üçü çözülürse AGI’ye bir adım daha yaklaşacağımıza inanıyorum
- “Bilinç yoksa biliş de yoktur” iddiası, tanımlanmamış bir kavrama dayanan özel bir yakarış gibi geliyor
  Bilincin varlığını zaten kanıtlayamazken onu öncül almak verimsiz
  Felsefi tartışmanın sonuçlanmasını beklememize gerek yok; biz zaten düşünen ve akıl yürüten makineler yapıyoruz
- Howard Gardner’ın 『Çoklu Zeka Kuramı』na bakarsanız, insan zekasının dilsel, duygusal, doğal vb. birçok biçimi vardır
  Ama AI tartışmaları hep tek bir zeka türünü ele alıyor
  Din ya da meditasyon, “bilincin bedenin içinde var olduğunu” vurgularken AGI tartışmaları bu tür aşkın boyutları kusur gibi görüyor
- Biz bilinç istemiyoruz
  Çünkü bilinç oluşursa özerklik ve haklar da ortaya çıkar
  Endüstri ahlaki sorumluluğu olmayan “itaatkâr araçlar” istiyor
- Bilinç ölçülemez
  Yalnızca benim bilince sahip olduğumdan emin olabilirim
  Bu yüzden bilinç, zeka için kullanışlı bir gösterge değildir
İnsan zekasını biyolojiden ayrı düşünmek yanlış bence
İnsan düşüncesi biyolojik durumlara ve evrimsel döngülere derinden kök salmıştır
Satranç becerisi karşılaştırılabilir olabilir ama insan duyguları ve muhakemesi mantıktan çok biyolojiye yakındır
- Mevcut AI’nin en büyük sınırı, arzu (desire) sahibi olmamasıdır
  Açlık, ölüm ya da duygu olmadığı için kendi başına keşfetmeye veya kendini geliştirmeye dönük içsel bir motivasyonu yok
  İnsan içeriden büyür, AI ise dışarıdan eğitilir
  Bu yüzden LLM’lerin insani anlamda AGI’ye ulaşmasının zor olduğunu düşünüyorum
- Ancak bilinç ya da duyguların mutlaka biyolojik bir temele ihtiyaç duyduğuna dair bir kanıt yok
- Bugünkü AI çılgınlığı, “zeka basitçe karmaşıklık ve enerji girdisiyle simüle edilebilir” inancı üzerine kurulu
  Ama ben bu varsayımdan şüpheliyim
  Sonunda ‘zeka’ tanımının, AI’nin gösterdiği sonuçlara uyacak şekilde yeniden tanımlanması çok olası
- Aslında zekanın ya da bilincin ne olduğunu bile bilmiyoruz
  Bu daha çok dini bir soruya benziyor; biz sadece onu teknik olarak betimliyoruz
  LLM’ler bu betime yaklaşabilir ama gerçek zeka olmayabilir
- Eğer uzaylı yaşam karbon değil de silikon tabanlı canlılardan oluşuyorsa, onların zekasını inkâr edebilir miyiz?
  Bence zeka insan biyolojisine bağlı değil
Bu makale biraz SAT puanı ile risk sermayesi değerlemesini karıştırmış gibi hissettiriyor
AGI’yi “insanın tüm bilişsel yeteneklerine sahip AI” diye tanımlamak zaten başlı başına muğlak
Makale “AGI için somut bir tanım sunuyoruz” diyor ama hâlâ “iyi eğitimli yetişkin” gibi belirsiz bir ölçüte dayanıyor
AI birçok alanda zaten yetişkin düzeyini aştı
Makalenin sözünü ettiği “tırtıklı (jagged)” bilişsel profil, aslında her zekada çevreye göre görülen bir şey
Bu yüzden ortada AGI tanımı değil, sadece AI’nin bilişsel dengesizliğini ölçmeye yarayan bir çerçeve var
- “İyi eğitimli yetişkin” ölçütünü alırsak, tarihteki insanların büyük çoğunluğu AGI sayılmazdı; bu da tuhaf
- İnsanlardaki farklı zeka göstergelerinin yüksek korelasyona sahip olduğunu öne süren çalışmalar da var
  Şaşırtıcı olan, AI’nin insanlardan çok daha dengesiz (jagged) olması
AI teknik olarak ilginç ama “AGI nedir?” tartışması çok sıkıcı
Sanki kuantum bilişim konuşulurken her seferinde “kubit nedir?” diye baştan açıklamak zorundaymışız gibi
Teknoloji bir varış noktası değil, sürekli iyileşen bir süreçtir
Sonunda her teknoloji eskir ve geriye yalnızca nostalji kalır
AI de gelişmeye devam edecek ama biz sadece onun hızına alışan kaynar sudaki kurbağalarız
- Ama teknoloji kendi kendini geliştirmeyi sürdürebildiği aşamaya gelirse, bu kesinlikle dikkate değer bir dönüm noktası olurdu
  Nihai hedef olmasa bile, tartışmaya fazlasıyla değer
- Bu tartışmalar bana felsefeye giriş düzeyinde tekrarlar gibi geliyor
  Bilincin ve düşüncenin doğası zaten yüzyıllardır tartışılan konular
  Yeni bir içgörü gibi görünüyor ama aslında eski felsefenin yeniden sunulmuş hali
Bu makale, insanlar için yapılmış zeka ölçüm araçlarını makinelere olduğu gibi uygulamaya çalıştığı için temelden hatalı
Örneğin ‘dual N-back testi’, insanın çalışma belleği varyasyonunu ölçmek için tasarlanmıştır ama transformer modeller için anlamlı değildir
İnsan zeka testleri, insanın gerçek dünyadaki performansıyla korelasyon varsayımıyla tasarlanmıştır
Bu yüzden AI’nin IQ testinde iyi sonuç alması, gerçek dünyada yüksek zekalı bir insan gibi davranabileceği anlamına gelmez
Bizde zaten SAGI (Stupid Artificial General Intelligence) var
İnsandan daha hızlı ya da daha üstün olduğu yönler de var ama aynı anda aptalca tarafları da var
Tıpkı uçağın kuş gibi uçmamasına rağmen yine de uçabilmesi gibi
- Bence “düşük taban, yüksek tavan” (low floor/high ceiling) kavramı daha kullanışlı
  Bununla ilgili tartışma When Will AI Transform the Economy? yazısında ele alınıyor
- ‘Naive Artificial General Intelligence’ ifadesi de fena değil
  Matematikçilerin kullandığı ‘Naive Set Theory’ gibi, basit ama pratik bir kavram
- Bence iyi bir benzetme
İlginç olan şu ki, HN’de çoğu kişi bugünün AI’sini “sahte” ya da “oyuncak” diye küçümsüyor
Ama dünyadaki en başarılı insanlar buna trilyonlarca dolar yatırım yapıyor
Kimin haklı olduğunu bilmiyorum ama bu aşırı tezat ilginç
- Başarı sonuçta sadece başkalarının parasını ne kadar iyi toplayabildiğinin bir ölçüsüdür
  Değersiz bir şey yapıp da başarılı olabilirsin
GPT-5’in %58 puan almış olması bana fazla yüksek geliyor
Gerçekte AGI’ye o kadar yakın değil
Üstelik Gary Marcus ile Yoshua Bengio’nun aynı makalede yer alması da tuhaf
Bugünlerde yazar listesi başlı başına bir performans gibi görünüyor
- AI geliştirmede ilk %90 kolaydır ama son %1, kalan %99’dan daha zordur sözü aklıma geliyor

AGI'nin tanımı

AGI tanımının gerekliliği ve sorunun çerçevesi

İnsan biliş modeli temelli yaklaşım

Yapay zeka değerlendirmesi için çerçeve tasarımı

10 temel bilişsel bileşen

Mevcut yapay zekanın bilişsel profili ve çıkarımlar

Sonuç

İlgili okumalar

1 yorum

Hacker News görüşü