LLM’lerin daha gidecek çok yolu var
- LLM’ler yalnızca çok miktarda bilgiyi ezberleyip gerektiğinde geri çağırmaktan ibaret olduğundan, gerçekten insan seviyesinde zekâya sahip oldukları söylenemez. Gerçek insan seviyesinde zekâ, son derece sınırlı eğitim verisiyle bile bunu genelleyip ilk kez karşılaşılan durumlarda sorun çözebilecek düzeyi ifade eder.
- İnsanlar bir köpek ile kediyi ayırt etmek için sadece birkaç fotoğraf görse yeterliyken, bir CNN modelinin 25.000 fotoğrafa ihtiyacı vardır. İnsan beyni, yapay zekâyla kıyaslanamayacak kadar az eğitim verisiyle bile nesneleri çok hızlı ve doğru biçimde sınıflandırabilir.
- Aynı matematik problemini çözerken, ilkeyi anlamadan yalnızca benzer soruları daha önce çözmüş olma deneyimine dayanarak o ana uygun formülü hatırlayıp problemi çözdüyseniz, bu ancak iyi arama yapmış olmak olur; buna gerçek zekâ demek zordur. Ezberleyerek 100 alan kişi ile ilkeyi anlayarak 100 alan kişiyi ayırt etmek gerekir.
- Bugünkü LLM’lerin ölçek büyüdükçe performanslarının artmasının ve hâlâ halüsinasyon üretmelerinin nedeni de tam olarak budur. Eğitim miktarı arttıkça geri çağrılabilecek formül sayısı çoğalır ve daha fazla duruma yanıt verilebilir; ancak uygun formül bulunamaz ya da yanlış bulunursa halüsinasyon ortaya çıkar.
- Ancak formülleri ezberleyip problem çözmek aslında insanlar için de büyük ölçüde geçerlidir. Gerçekten çok az sayıdaki kişi dışında çoğumuz, ezberlenmiş formülleri farklı durumlara uygulayarak yaşarız; yine de burada yapay zekâ ile insan arasında bir fark vardır.
- Günümüz yapay zekâsı yüzeysel arama yaparken, insanlar düşünceden düşünceye uzanan akıl yürütme sayesinde daha derin arama yapabilir.
- “Zekâ” dediğimiz kavram ayrıca şu üç seviyeye ayrılabilir.
- Olguları görüp ilkeleri anlayarak bunu geniş bir alanda kullanabilme yeteneği (dâhi)
- Önceden öğrenilmiş çeşitli kalıpları derinlemesine inceleyip en uygun kalıbı kullanabilme yeteneği (sıradan insan)
- Önceden öğrenilmiş çeşitli kalıpları yüzeysel biçimde inceleyip en hızlı bulunanı kullanabilme yeteneği (bugünkü LLM’ler)
- Bugünkü LLM’lerin bulunduğu yer 3. seviye. En iyisi 1. seviyeye çıkmalarıdır; en azından 2. seviyeye ulaşmaları gerekir ki bizim AGI (Artificial General Intelligence) dediğimiz noktaya varılabilsin.
1 milyon dolarlık ödüllü ARC Prize
- Gerçek insan seviyesinde zekâya sahip olup olmadığını değerlendirmek için bir test yöntemi geliştirildi ve bunun için 1 milyon dolarlık ödül veren ARC Prize yarışması oluşturuldu. (https://www.kaggle.com/competitions/arc-prize-2024)
- Yarışmanın resmi sitesinde (https://arcprize.org/) bulmacaları çözmeyi deneyebilirsiniz; insanlar için zorluk seviyesi yaklaşık bir IQ testi düzeyindeyken yapay zekâ bu soruları hâlâ iyi çözemiyor.
Sonuçlar paylaşıldıkça ilerleme hızlanır
- OpenAI’nin bilgi paylaşmayan kültürü sektöre yayması, AGI’nin ortaya çıkışını en az 5 ila 10 yıl geciktirdi.
- AGI’yi geliştirmek için çok sayıda deneme gerekir; ancak OpenAI dikkatleri üzerine çekince sektördeki insan ve maddi kaynaklar yalnızca LLM geliştiren yerlere yoğunlaşıyor.
- Bunun kaçınılmaz sonucu olarak diğer araştırma alanlarının desteği azalıyor ve sonuçlar daha yavaş ortaya çıkıyor.
- Üstelik OpenAI artık makale yayımlasa bile teknik ayrıntıları paylaşmadığı için, sektördeki diğer araştırmacıların bu makalelere dayanarak başka araştırmalar yürütmesi zorlaşıyor.
- OpenAI ortaya çıkmadan önce, örneğin Attention is all you need makalesinde olduğu gibi, farklı kurumlardan araştırmacılar aidiyetlerinden bağımsız biçimde iş birliği yaparak yapay zekânın hızlı gelişimini sağlıyordu; ancak OpenAI kendi keşiflerini sektörle paylaşmayan bir kültürü yaygınlaştırarak sektörün ilerlemesini engelliyor.
- ARC Prize yarışması sayesinde araştırmacıların yeniden sonuçlarını aktif biçimde paylaşması ve sektörün ilerlemesinin tekrar hızlanması umuluyor.
2 yorum
Sanırım o1 modeli 2.'ye yaklaşmış gibi görünüyor.
Evet, ben de öyle düşünüyorum.