- AGI'nin tanımı hâlâ belirsiz ve mevcut insan merkezli testlerle yapay zekanın zekâsını ya da yaratıcılığını doğru ölçmek zor
- OpenAI'nin o3'ü ve Google'ın Gemini 2.5'i, gerçek işlerin yerine getirilmesinde çok yüksek bir seviye gösteriyor ve AGI'ye yakın bir performansa sahip
- o3, araçları kullanarak karmaşık hedefleri çözebilen bir ajanik model ve bu da Jagged AGI kavramını ortaya çıkarıyor
- Yapay zeka, zor görevleri çözerken temel problemlerde hata yapabiliyor; yani yetenekleri dengesiz ve bu durum Jagged Frontier ile açıklanıyor
- Teknolojinin kendisinden çok onun kullanımı ve entegrasyonu yavaş ilerlediği için, AGI gerçekleşse bile toplumsal değişimin zaman alması mümkün
AGI'ye gerçekten ulaşıldı mı?
- Günümüzde yapay zekanın zekâsını, yaratıcılığını ve empati yeteneğini ölçme yöntemleri isabetsiz ve çoğu insan için oluşturulmuş ölçütlere dayanıyor
- Turing Testi bile artık yapay zeka tarafından geçilebiliyor, ancak bu sonucun anlamı hâlâ belirsiz
- AGI kavramı uzun zamandır var olsa da, bugün bile hangi kriterler karşılanırsa AGI deneceği konusunda bir uzlaşma yok
- AGI kavramını yapay zeka üzerinden anlatan video ve doküman özet içerikleri de deneysel olarak yalnızca yapay zeka ile üretiliyor ve kullanılıyor
o3 ve Gemini 2.5'in gösterdiği performans
- OpenAI'nin o3'ü ve Google'ın Gemini 2.5 Pro'su en yeni modeller arasında ve sıçramalı bir performans artışı sergiliyor
- Tek bir prompt ile pazarlama sloganı yazmaktan web sitesi oluşturmaya kadar işleri uçtan uca yerine getirebiliyor
- o3, açık bir talimat olmadan bile araç kullanma, web'de gezinme, kod yazma gibi birleşik görevleri otomatik olarak yürütüyor
- Görsellerden konum tahmini yapan bir geo-guesser rolünde de insan seviyesinin üzerinde performans gösteriyor
- Veri analizi ve rapor oluşturma da tek bir komutla mümkün; buna PDF üretimi ve görselleştirme de dahil
Jagged AGI: dengesiz yapay zeka yetenekleri
- Yapay zeka, insanlardan daha iyi yaptığı işler varken basit sorunlarda hata yapabilen dengesiz yeteneklere sahip
- Örnek: Geleneksel önyargıyı ortaya çıkaran bilmecelerde doğru cevabı verirken, benzer dönüştürülmüş sorularda hata yapabiliyor
- Bu, yapay zekanın eğitim verisine aşırı derecede bağımlı olduğunu ve genelleştirmede zayıf kaldığını gösteriyor
- Ancak bu durum, yapay zekanın belirli problemlerde insanı aşabilmesine engel olmuyor
- Bu tür dengesiz duruma “Jagged Frontier” deniyor ve AGI'ye yakın yeteneklerin eşitsiz biçimde ortaya çıkmasını anlatıyor
AGI anlamlı mı?
- Tyler Cowen, o3'ün AGI olabileceğini düşünüyor; ancak gerçek etkisinin ancak zamanla ortaya çıkacağını savunuyor
- Teknolojik ilerleme hızından daha yavaş olan toplumsal ve kurumsal değişim, yapay zekanın benimsenmesini yavaşlatabilir
- Ancak o3 gibi ajanik niteliklere sahip yapay zekalar, araç kullanma ve problemi parçalara ayırma becerileri sayesinde hızla yayılabilir
- Teknolojinin kademeli olarak mı genişleyeceği, yoksa belirli bir eşiği aştıktan sonra hızla mı yayılacağı henüz belirsiz
- Önemli olan nokta, bugünün yapay zekasının öncekilerden niteliksel olarak farklı bir teknoloji olması ve hâlâ bilinmeyen bir alanda bulunması
Geleceğe hazırlanma yaklaşımı
- Bugünün yapay zekasına tam anlamıyla AGI demek zor, ancak bazı alanlarda AGI'ye yakın sonuçlar üretiyor
- Yapay zeka her işi kusursuz şekilde yapamıyor; insan uzmanların değerlendirmesi ve koordinasyonu hâlâ gerekli
- Mevcut “Jagged AGI” bile zaman içinde her alanda insanı geçebilir
- Bu belirsiz gelecekte en önemli şey, şimdiden yapay zekayı deneyimleme ve ondan yararlanma tecrübesi kazanmak
2 yorum
Hacker News yorumu
Gemini 2.5 Pro benim için önemli bir dönüm noktası. Önceki LLM’ler özellikle kodlama işlerinde çok etkileyiciydi. Ancak kodlama yardımı dışında, Google aramadan biraz daha faydalı olmalarının ötesine geçmiyorlardı. Kısa süre önce 2.5 Pro’yu büyük bir araştırma önerisi yazarken yardımcı olması için kullandım. Ayrıntılara girmeyeyim, ama ben istemediğim için metnin tamamını yazmamış gibi hissettirdi. Son teslim tarihi yaklaşırken daha fazla kısmı ona bıraktım ve proje planı ile takvim oluşturma gibi karmaşık işleri yaptı. Bu 10 kat etki yarattı.
Bilimsel sorularda 2.5 Pro’ya ekipteki uzmanlardan daha fazla güvenmeye başladım. Tüm araştırma verilerini Gemini’ye bağlamanın daha da büyük bir değişim yaratacağından eminim. Bunun nedeni yapay zekanın nesnel olması. “AGI”yi engelleyen başlıca unsur, insanların meydan okuma isteği ile bağlam penceresi ve hesaplama erişilebilirliği.
Yapay zekanın yetenekleri gpt3’ten bu yana olağanüstü hale geldi. Ancak AGI konusunda hâlâ genel bir uzlaşı yok. Birçok kişi AGI’nin yakında geleceğini bekliyor, ama bu abartılı beklentilerle birlikte gelecek. Bu makale makul, ancak başlığı ve sloganı abartılı beklentileri körüklüyor.
Sorun, yapay zekanın bilmeceyi yanlış okuması değil; kullanıcının bilmeceyi düzgün vermediğini varsayıyor gibi görünüyor. Yapay zekanın takip soruları sorabilmesi iyi olurdu, ama şu an bunu yapmıyor.
o4-mini-high’ın bilmeceyi çözmesine örnek: “Bir pound cesaret mi yoksa bir pound madeni para mı daha ağırdır?” İkisi de “pound” olduğu için ağırlıkları aynıdır.
AGI için bir tanım olmadığı için “Jagged AGI” diye bir terim uyduruluyor. Yapay zeka bazı görevlerde güvenilmez, ama başka görevlerde insanüstü. Yapay zeka zaten genel yetenekler sergiliyor.
Model dış sistemlerle etkileşime girdiğinde şaşırtıcı uygulamalar mümkün hale geliyor. Ancak bu, AGI’ye doğru ilerleme değil, yatay bir hareket.
Gemini 2.5’i seviyorum ve fiyatı da harika. AGI anlatısı yorucu geliyor. Bu sistemleri “kültürel teknoloji” olarak görmek gerektiğini düşünüyorum.
Video röportajdan kimsenin bahsetmemesine şaşırdım. Sadece ilk 60 saniyeyi izledim, ama bunun yapay zeka üretimi olduğu söylenmeseydi gerçek sanırdım.
AGI’nin özerklik, uzun süreli hafıza, motivasyon, merak, dayanıklılık, hedefler, seçim, korku gibi şeylere sahip olması gerekip gerekmediğini merak ediyorum. Sonuçta AGI, onu kontrol eden kişinin bir uzantısı olacak.
Yapay zeka genel olarak güvenilir değil ve belirli görevlerde test edilmesi gerekiyor. Bu, tekil çıktının insan tarafından incelenmesi ya da görev bazlı değerlendirme olabilir. Yapay zekanın genel performansı hakkında konuşmak zor; yalnızca yeni bir modelin belirli bir görev için uygun olup olmadığına dair makul tahminler yapılabilir.
Yapay zekâ da algıya benzer bir şeye sahip olduğu için, yapay zekâyla birlikte yaşayacaksak yapay zekâ için kurumlar ya da yasalar oluşturulması gerekecektir. 22. yüzyılın yeni bir yaşam formu olarak ona bir oyuncakmış gibi sataşılmamalı; ayrıca bir bakıma tehlikeli de olabileceği için yapay zekâyı yalnızca geliştirmek ve kullanmak değil, güvenli şekilde kullanılabilmesini sağlamak da gerekli.