Dengesiz (Jagged) AGI Üzerine: o3, Gemini 2.5 ve Sonrasındaki Yapay Zekalar

(oneusefulthing.org)

4 puan yazan GN⁺ 2025-04-22 | 2 yorum | WhatsApp'ta paylaş

AGI'nin tanımı hâlâ belirsiz ve mevcut insan merkezli testlerle yapay zekanın zekâsını ya da yaratıcılığını doğru ölçmek zor
OpenAI'nin o3'ü ve Google'ın Gemini 2.5'i, gerçek işlerin yerine getirilmesinde çok yüksek bir seviye gösteriyor ve AGI'ye yakın bir performansa sahip
o3, araçları kullanarak karmaşık hedefleri çözebilen bir ajanik model ve bu da Jagged AGI kavramını ortaya çıkarıyor
Yapay zeka, zor görevleri çözerken temel problemlerde hata yapabiliyor; yani yetenekleri dengesiz ve bu durum Jagged Frontier ile açıklanıyor
Teknolojinin kendisinden çok onun kullanımı ve entegrasyonu yavaş ilerlediği için, AGI gerçekleşse bile toplumsal değişimin zaman alması mümkün

AGI'ye gerçekten ulaşıldı mı?

Günümüzde yapay zekanın zekâsını, yaratıcılığını ve empati yeteneğini ölçme yöntemleri isabetsiz ve çoğu insan için oluşturulmuş ölçütlere dayanıyor
Turing Testi bile artık yapay zeka tarafından geçilebiliyor, ancak bu sonucun anlamı hâlâ belirsiz
AGI kavramı uzun zamandır var olsa da, bugün bile hangi kriterler karşılanırsa AGI deneceği konusunda bir uzlaşma yok
AGI kavramını yapay zeka üzerinden anlatan video ve doküman özet içerikleri de deneysel olarak yalnızca yapay zeka ile üretiliyor ve kullanılıyor

o3 ve Gemini 2.5'in gösterdiği performans

OpenAI'nin o3'ü ve Google'ın Gemini 2.5 Pro'su en yeni modeller arasında ve sıçramalı bir performans artışı sergiliyor
Tek bir prompt ile pazarlama sloganı yazmaktan web sitesi oluşturmaya kadar işleri uçtan uca yerine getirebiliyor
o3, açık bir talimat olmadan bile araç kullanma, web'de gezinme, kod yazma gibi birleşik görevleri otomatik olarak yürütüyor
Görsellerden konum tahmini yapan bir geo-guesser rolünde de insan seviyesinin üzerinde performans gösteriyor
Veri analizi ve rapor oluşturma da tek bir komutla mümkün; buna PDF üretimi ve görselleştirme de dahil

Jagged AGI: dengesiz yapay zeka yetenekleri

Yapay zeka, insanlardan daha iyi yaptığı işler varken basit sorunlarda hata yapabilen dengesiz yeteneklere sahip
Örnek: Geleneksel önyargıyı ortaya çıkaran bilmecelerde doğru cevabı verirken, benzer dönüştürülmüş sorularda hata yapabiliyor
Bu, yapay zekanın eğitim verisine aşırı derecede bağımlı olduğunu ve genelleştirmede zayıf kaldığını gösteriyor
Ancak bu durum, yapay zekanın belirli problemlerde insanı aşabilmesine engel olmuyor
Bu tür dengesiz duruma “Jagged Frontier” deniyor ve AGI'ye yakın yeteneklerin eşitsiz biçimde ortaya çıkmasını anlatıyor

AGI anlamlı mı?

Tyler Cowen, o3'ün AGI olabileceğini düşünüyor; ancak gerçek etkisinin ancak zamanla ortaya çıkacağını savunuyor
Teknolojik ilerleme hızından daha yavaş olan toplumsal ve kurumsal değişim, yapay zekanın benimsenmesini yavaşlatabilir
Ancak o3 gibi ajanik niteliklere sahip yapay zekalar, araç kullanma ve problemi parçalara ayırma becerileri sayesinde hızla yayılabilir
Teknolojinin kademeli olarak mı genişleyeceği, yoksa belirli bir eşiği aştıktan sonra hızla mı yayılacağı henüz belirsiz
Önemli olan nokta, bugünün yapay zekasının öncekilerden niteliksel olarak farklı bir teknoloji olması ve hâlâ bilinmeyen bir alanda bulunması

Geleceğe hazırlanma yaklaşımı

Bugünün yapay zekasına tam anlamıyla AGI demek zor, ancak bazı alanlarda AGI'ye yakın sonuçlar üretiyor
Yapay zeka her işi kusursuz şekilde yapamıyor; insan uzmanların değerlendirmesi ve koordinasyonu hâlâ gerekli
Mevcut “Jagged AGI” bile zaman içinde her alanda insanı geçebilir
Bu belirsiz gelecekte en önemli şey, şimdiden yapay zekayı deneyimleme ve ondan yararlanma tecrübesi kazanmak

2 yorum

GN⁺ 2025-04-22

Hacker News yorumu

Gemini 2.5 Pro benim için önemli bir dönüm noktası. Önceki LLM’ler özellikle kodlama işlerinde çok etkileyiciydi. Ancak kodlama yardımı dışında, Google aramadan biraz daha faydalı olmalarının ötesine geçmiyorlardı. Kısa süre önce 2.5 Pro’yu büyük bir araştırma önerisi yazarken yardımcı olması için kullandım. Ayrıntılara girmeyeyim, ama ben istemediğim için metnin tamamını yazmamış gibi hissettirdi. Son teslim tarihi yaklaşırken daha fazla kısmı ona bıraktım ve proje planı ile takvim oluşturma gibi karmaşık işleri yaptı. Bu 10 kat etki yarattı.
Bilimsel sorularda 2.5 Pro’ya ekipteki uzmanlardan daha fazla güvenmeye başladım. Tüm araştırma verilerini Gemini’ye bağlamanın daha da büyük bir değişim yaratacağından eminim. Bunun nedeni yapay zekanın nesnel olması. “AGI”yi engelleyen başlıca unsur, insanların meydan okuma isteği ile bağlam penceresi ve hesaplama erişilebilirliği.
Yapay zekanın yetenekleri gpt3’ten bu yana olağanüstü hale geldi. Ancak AGI konusunda hâlâ genel bir uzlaşı yok. Birçok kişi AGI’nin yakında geleceğini bekliyor, ama bu abartılı beklentilerle birlikte gelecek. Bu makale makul, ancak başlığı ve sloganı abartılı beklentileri körüklüyor.
Sorun, yapay zekanın bilmeceyi yanlış okuması değil; kullanıcının bilmeceyi düzgün vermediğini varsayıyor gibi görünüyor. Yapay zekanın takip soruları sorabilmesi iyi olurdu, ama şu an bunu yapmıyor.
o4-mini-high’ın bilmeceyi çözmesine örnek: “Bir pound cesaret mi yoksa bir pound madeni para mı daha ağırdır?” İkisi de “pound” olduğu için ağırlıkları aynıdır.
AGI için bir tanım olmadığı için “Jagged AGI” diye bir terim uyduruluyor. Yapay zeka bazı görevlerde güvenilmez, ama başka görevlerde insanüstü. Yapay zeka zaten genel yetenekler sergiliyor.
Model dış sistemlerle etkileşime girdiğinde şaşırtıcı uygulamalar mümkün hale geliyor. Ancak bu, AGI’ye doğru ilerleme değil, yatay bir hareket.
Gemini 2.5’i seviyorum ve fiyatı da harika. AGI anlatısı yorucu geliyor. Bu sistemleri “kültürel teknoloji” olarak görmek gerektiğini düşünüyorum.
Video röportajdan kimsenin bahsetmemesine şaşırdım. Sadece ilk 60 saniyeyi izledim, ama bunun yapay zeka üretimi olduğu söylenmeseydi gerçek sanırdım.
AGI’nin özerklik, uzun süreli hafıza, motivasyon, merak, dayanıklılık, hedefler, seçim, korku gibi şeylere sahip olması gerekip gerekmediğini merak ediyorum. Sonuçta AGI, onu kontrol eden kişinin bir uzantısı olacak.
Yapay zeka genel olarak güvenilir değil ve belirli görevlerde test edilmesi gerekiyor. Bu, tekil çıktının insan tarafından incelenmesi ya da görev bazlı değerlendirme olabilir. Yapay zekanın genel performansı hakkında konuşmak zor; yalnızca yeni bir modelin belirli bir görev için uygun olup olmadığına dair makul tahminler yapılabilir.

thd34 2025-04-22

Yapay zekâ da algıya benzer bir şeye sahip olduğu için, yapay zekâyla birlikte yaşayacaksak yapay zekâ için kurumlar ya da yasalar oluşturulması gerekecektir. 22. yüzyılın yeni bir yaşam formu olarak ona bir oyuncakmış gibi sataşılmamalı; ayrıca bir bakıma tehlikeli de olabileceği için yapay zekâyı yalnızca geliştirmek ve kullanmak değil, güvenli şekilde kullanılabilmesini sağlamak da gerekli.