- Yapay zeka araştırmalarında AGI (Artificial General Intelligence) için net bir tanımın olmaması, insan düzeyindeki biliş ile mevcut yapay zeka arasındaki farkı bulanıklaştırıyor
- Bu makale, AGI'yi “iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zeka” olarak tanımlayan nicelleştirilebilir bir çerçeve sunuyor
- İnsan bilişi araştırmalarındaki başlıca modellerden biri olan Cattell-Horn-Carroll (CHC) kuramı temel alınarak, insan genel zekası 10 temel bilişsel alana ayrıştırılıyor ve yapay zeka değerlendirmesine uygulanıyor
- Bu çerçeveyle GPT-4 ve GPT-5'in bilişsel profilleri sayısallaştırıldı; GPT-4 %27, GPT-5 ise %57 AGI puanı aldı
- Bu durum, yapay zekanın hızlı ilerleyişini gösterirken aynı zamanda uzun süreli bellek depolama gibi temel bilişsel yeteneklerdeki eksiklikler nedeniyle AGI'ye ulaşmada hâlâ büyük bir fark bulunduğuna işaret ediyor
AGI tanımının gerekliliği ve sorunun çerçevesi
- AGI (Artificial General Intelligence) insanlık tarihindeki en önemli teknolojik gelişmelerden biri olarak görülse de, tanımının muğlak olması tartışmalara yol açıyor
- Yapay zeka; matematik, sanat ve benzeri, eskiden insan zekası gerektirdiği düşünülen alanları giderek fethettikçe, “AGI” için ölçüt de sürekli yer değiştiriyor
- Bu da AGI'ye ne zaman ve hangi düzeyde ulaşılacağına dair tartışmaları verimsiz hâle getiriyor ve mevcut yapay zeka ile AGI arasındaki gerçek farkı perdeleyebiliyor
- Bu makale, bu muğlaklığı ortadan kaldırmak için nicel ve sistematik bir çerçeve öneriyor
- Önerilen tanım: “AGI, iyi eğitim almış bir yetişkinin bilişsel çeşitliliğine ve yetkinliğine sahip yapay zekadır”
- Bu, tek bir görevi yerine getirme becerisinden ziyade, hem bilişsel genişliğe (versatility) hem de derinliğe/yetkinliğe (proficiency) sahip bir zekayı ifade ediyor
İnsan biliş modeli temelli yaklaşım
- AGI tanımını pratikte hayata geçirmek için insan bilişinin yapısı model olarak alınıyor
- İnsan genel zekası tek bir yetenek değil, evrim tarafından şekillendirilmiş çeşitli bilişsel yeteneklerin birleşiminden oluşuyor
- Bu yetenekler, insanın uyum sağlama becerisini ve dünyayı anlama kapasitesini mümkün kılıyor
- Çalışma, Cattell-Horn-Carroll (CHC) kuramını temel alıyor
- CHC kuramı, 100 yılı aşkın sürede birikmiş bilişsel yetenek testlerinin faktör analizlerini bir araya getiren, ampirik olarak en güçlü biçimde doğrulanmış insan zekası modeli
- 1990'lar ve 2000'lerden bu yana klinik amaçlı zeka testlerinin büyük bölümü CHC modeline dayanarak tasarlandı
- CHC, insan zekasını üst (geniş kapsamlı) yetenekler ve alt (ayrıntılı) yetenekler şeklinde hiyerarşik olarak sınıflandırıyor
- Örneğin: tümevarımsal akıl yürütme, çağrışımsal bellek, mekânsal keşif
Yapay zeka değerlendirmesi için çerçeve tasarımı
- On yıllar boyunca biriken psikometrik test sistemleri, yapay zeka değerlendirmesine uygun olacak şekilde dönüştürülüyor
- Mevcut yapay zeka değerlendirmeleri genelleştirilmiş görev performansına dayanırken, bu çalışma doğrudan CHC'nin ayrıntılı bilişsel yeteneklerine sahip olup olmadığını sınıyor
- İnsanlar için kullanılan bilişsel testlerle aynı biçimdeki testler yapay zekaya uygulanarak bilişsel çeşitlilik ve yetkinlik ölçülüyor
- Sonuçlar standartlaştırılmış AGI puanı (%0~100) olarak ifade ediliyor; %100 tam AGI anlamına geliyor
- GPT-4 %27, GPT-5 ise %57 olarak değerlendirildi; bu da hem hızlı gelişimi hem de hâlâ büyük bir fark bulunduğunu gösteriyor
- Deney sonuçlarına göre yapay zeka, karmaşık benchmark'larda etkileyici olsa da insanlar için basit sayılabilecek temel bilişsel görevlerin ancak yaklaşık yarısını çözebiliyor
- Bu da mevcut yapay zekanın bazı alanlarda çok güçlü olsa da genel bilişsel genişlik açısından insandan daha dar bir zeka yapısına sahip olduğunu gösteriyor
10 temel bilişsel bileşen
- Çerçeve, CHC'nin geniş yeteneklerini temel alarak 10 temel bilişsel alan tanımlıyor ve her alana eşit ağırlık (%10) veriyor
- Genel bilgi (General Knowledge, K): sağduyu, kültür, bilim, sosyal bilimler, tarih gibi dünya hakkında olgusal anlayışın genişliği
- Okuma ve yazma becerisi (Reading & Writing, RW): dil çözümleme, anlama, yazma, üslup kullanımı gibi metin işleme becerileri
- Matematiksel yetenek (Mathematical Ability, M): aritmetik, cebir, geometri, olasılık, kalkülüs gibi matematik bilgisi ve problem çözme becerileri
- Anlık akıl yürütme (On-the-Spot Reasoning, R): mevcut bilgiye dayanmadan yeni problemleri çözmeye yönelik esnek dikkat kontrolü becerisi
- Çalışma belleği (Working Memory, WM): metinsel, işitsel ve görsel bilgiyi aynı anda koruma ve işleme becerisi
- Uzun süreli bellek depolama (Long-Term Memory Storage, MS): yeni bilgiyi kalıcı biçimde öğrenme ve depolama becerisi
- Uzun süreli bellekten geri getirme (Long-Term Memory Retrieval, MR): depolanmış bilgiyi doğru biçimde çağırma ve halüsinasyondan/confabulation'dan kaçınma becerisi
- Görsel işleme (Visual Processing, V): görsel bilgiyi algılama, analiz etme, üretme ve keşfetme becerisi
- İşitsel işleme (Auditory Processing, A): konuşma, ritim, müzik gibi işitsel uyaranları ayırt etme, tanıma ve yaratıcı biçimde kullanma becerisi
- Hız (Speed, S): basit bilişsel görevleri hızlı biçimde yerine getirme becerisi; algısal hız, tepki süresi ve işlem akıcılığını içerir
- Bu 10 alan sayesinde metin, görsel ve işitsel veriyi kapsayan çok modlu bir değerlendirme mümkün oluyor; yapay zekanın güçlü ve zayıf yanları hassas biçimde teşhis edilebiliyor
Mevcut yapay zekanın bilişsel profili ve çıkarımlar
- GPT-4 ve GPT-5'in bilişsel yetenekleri karşılaştırıldığında, bilgi merkezli alanlarda güçlü, bellekle ilgili alanlarda ise belirgin biçimde yetersiz oldukları görülüyor
- Özellikle uzun süreli bellek depolama becerisi en büyük eksiklik olarak öne çıkıyor
- Bu, mevcut yapay zekada insan düzeyinde genel zekaya ulaşmak için gerekli temel bilişsel yapının eksik olduğunu gösteriyor
- Çerçeve, yapay zeka ilerlemesini nicel olarak izleme aracı olarak kullanılabilir
- AGI puanı sayesinde modeller arasındaki gelişim hızı ve kalan fark açık biçimde sayısallaştırılabiliyor
- Gelecekte yapay zeka araştırmalarında bilişsel açıdan dengeli gelişimin önemini vurgulayan bir gösterge işlevi görebilir
Sonuç
- Bu çalışma, AGI tartışmalarındaki muğlaklığı gideriyor ve insan biliş modeli temelli nicel bir tanım sunuyor
- CHC kuramına dayalı 10 bilişsel alan değerlendirmesi sayesinde, yapay zekanın bilişsel genişliği ve derinliği nesnel olarak ölçülebiliyor
- GPT-4 ve GPT-5 sonuçları, yapay zekanın hızla ilerlediğini; ancak bellek, akıl yürütme ve duyusal entegrasyon becerileri gibi temel bilişsel unsurlarda insanla arasında hâlâ büyük fark bulunduğunu gösteriyor
- Önerilen çerçeve, gelecekteki AGI araştırmaları için standartlaştırılmış bir değerlendirme ölçütü olma potansiyeli taşıyor
1 yorum
Hacker News görüşü
AGI’yi “iyi eğitimli bir yetişkinin bilişsel çeşitliliği ve yetkinliği” olarak tanımlamak bana fazla iddialı bir hedef gibi geliyor
Aslında eğitim almamış bir çocuk düzeyinde bilişsel yeteneğe sahip bir yapay zeka bile muazzam bir başarı olurdu
Hayvan düzeyinde zekayı gerçekleştirmek bile insanlık tarihinde dönüm noktası niteliğinde bir olay olur diye düşünüyorum
Gerçek bir genel yapay zeka yapılacaksa, muhtemelen çevrimiçi olarak bilgi arayabilen, yalnızca gerektiğinde belleği koruyan, plan yapan ve bilgisini genişleten milyarlarca parametreli bir model olurdu
30 dil bilmesine ya da Wikipedia’nın tamamını ezbere bilmesine gerek yok
Benim AGI tanımıma uyan şey böyle verimli bir model olurdu
Eski Turing testi bile sonuçta açıklar verdi — sadece ortalama bir insan sorgulayıcıyı kandırmış olmak, gerçek zekaya sahip olmak anlamına gelmiyordu
Gerçek zekayı (I) tanımlayabilseydik, genellik (G) zaten doğal olarak peşinden gelirdi
Makaleyi okurken hissettiğim şey, “farkındalık (awareness)” üzerine hiçbir tartışma olmamasıydı
Biliş temelde bilinç gerektirir ama bilinci dille açıklamak ya da ölçmek zordur
Budizm ve felsefe bunu binlerce yıldır inceliyor ama hâlâ tanımlanabilmiş değil
Babam psikometri profesörü ve insan zekasını ölçen araçların kendisinin fazlasıyla kusurlu olduğunu söyler
Dil, insan bilgisini taşıyabilir ama “bilinç kıvılcımını” yakalayamaz
Meditasyon yaptığınızda düşünceler ortadan kalksa bile eylem mümkün olur — modelin öğrenemeyeceği şeyler bu tür sözel olmayan süreçlerdir
Bence LLM’ler, dilsel öngörü yapıları gereği bu tür bilinçdışı düşünme süreçlerini gerçekleştiremez
Hem insan beyni hem de LLM’ler içeride yüksek boyutlu kavram birleştirme ve vektör bağlama yapar
Sorun, sürekli öğrenme, uzun süreli bellek ve sonsuz bağlam işleme eksikliğidir
Bu üçü çözülürse AGI’ye bir adım daha yaklaşacağımıza inanıyorum
Bilincin varlığını zaten kanıtlayamazken onu öncül almak verimsiz
Felsefi tartışmanın sonuçlanmasını beklememize gerek yok; biz zaten düşünen ve akıl yürüten makineler yapıyoruz
Ama AI tartışmaları hep tek bir zeka türünü ele alıyor
Din ya da meditasyon, “bilincin bedenin içinde var olduğunu” vurgularken AGI tartışmaları bu tür aşkın boyutları kusur gibi görüyor
Çünkü bilinç oluşursa özerklik ve haklar da ortaya çıkar
Endüstri ahlaki sorumluluğu olmayan “itaatkâr araçlar” istiyor
Yalnızca benim bilince sahip olduğumdan emin olabilirim
Bu yüzden bilinç, zeka için kullanışlı bir gösterge değildir
İnsan zekasını biyolojiden ayrı düşünmek yanlış bence
İnsan düşüncesi biyolojik durumlara ve evrimsel döngülere derinden kök salmıştır
Satranç becerisi karşılaştırılabilir olabilir ama insan duyguları ve muhakemesi mantıktan çok biyolojiye yakındır
Açlık, ölüm ya da duygu olmadığı için kendi başına keşfetmeye veya kendini geliştirmeye dönük içsel bir motivasyonu yok
İnsan içeriden büyür, AI ise dışarıdan eğitilir
Bu yüzden LLM’lerin insani anlamda AGI’ye ulaşmasının zor olduğunu düşünüyorum
Ama ben bu varsayımdan şüpheliyim
Sonunda ‘zeka’ tanımının, AI’nin gösterdiği sonuçlara uyacak şekilde yeniden tanımlanması çok olası
Bu daha çok dini bir soruya benziyor; biz sadece onu teknik olarak betimliyoruz
LLM’ler bu betime yaklaşabilir ama gerçek zeka olmayabilir
Bence zeka insan biyolojisine bağlı değil
Bu makale biraz SAT puanı ile risk sermayesi değerlemesini karıştırmış gibi hissettiriyor
AGI’yi “insanın tüm bilişsel yeteneklerine sahip AI” diye tanımlamak zaten başlı başına muğlak
Makale “AGI için somut bir tanım sunuyoruz” diyor ama hâlâ “iyi eğitimli yetişkin” gibi belirsiz bir ölçüte dayanıyor
AI birçok alanda zaten yetişkin düzeyini aştı
Makalenin sözünü ettiği “tırtıklı (jagged)” bilişsel profil, aslında her zekada çevreye göre görülen bir şey
Bu yüzden ortada AGI tanımı değil, sadece AI’nin bilişsel dengesizliğini ölçmeye yarayan bir çerçeve var
Şaşırtıcı olan, AI’nin insanlardan çok daha dengesiz (jagged) olması
AI teknik olarak ilginç ama “AGI nedir?” tartışması çok sıkıcı
Sanki kuantum bilişim konuşulurken her seferinde “kubit nedir?” diye baştan açıklamak zorundaymışız gibi
Teknoloji bir varış noktası değil, sürekli iyileşen bir süreçtir
Sonunda her teknoloji eskir ve geriye yalnızca nostalji kalır
AI de gelişmeye devam edecek ama biz sadece onun hızına alışan kaynar sudaki kurbağalarız
Nihai hedef olmasa bile, tartışmaya fazlasıyla değer
Bilincin ve düşüncenin doğası zaten yüzyıllardır tartışılan konular
Yeni bir içgörü gibi görünüyor ama aslında eski felsefenin yeniden sunulmuş hali
Bu makale, insanlar için yapılmış zeka ölçüm araçlarını makinelere olduğu gibi uygulamaya çalıştığı için temelden hatalı
Örneğin ‘dual N-back testi’, insanın çalışma belleği varyasyonunu ölçmek için tasarlanmıştır ama transformer modeller için anlamlı değildir
İnsan zeka testleri, insanın gerçek dünyadaki performansıyla korelasyon varsayımıyla tasarlanmıştır
Bu yüzden AI’nin IQ testinde iyi sonuç alması, gerçek dünyada yüksek zekalı bir insan gibi davranabileceği anlamına gelmez
Bizde zaten SAGI (Stupid Artificial General Intelligence) var
İnsandan daha hızlı ya da daha üstün olduğu yönler de var ama aynı anda aptalca tarafları da var
Tıpkı uçağın kuş gibi uçmamasına rağmen yine de uçabilmesi gibi
Bununla ilgili tartışma When Will AI Transform the Economy? yazısında ele alınıyor
Matematikçilerin kullandığı ‘Naive Set Theory’ gibi, basit ama pratik bir kavram
İlginç olan şu ki, HN’de çoğu kişi bugünün AI’sini “sahte” ya da “oyuncak” diye küçümsüyor
Ama dünyadaki en başarılı insanlar buna trilyonlarca dolar yatırım yapıyor
Kimin haklı olduğunu bilmiyorum ama bu aşırı tezat ilginç
Değersiz bir şey yapıp da başarılı olabilirsin
GPT-5’in %58 puan almış olması bana fazla yüksek geliyor
Gerçekte AGI’ye o kadar yakın değil
Üstelik Gary Marcus ile Yoshua Bengio’nun aynı makalede yer alması da tuhaf
Bugünlerde yazar listesi başlı başına bir performans gibi görünüyor