-
OpenAI'ye göre GPT-4 ile GPT-3.5 arasındaki fark günlük konuşmalarda ince olabilir. Ancak görevler karmaşıklaştıkça GPT-4'ün daha istikrarlı, daha yaratıcı olduğu ve nüanslı yönergeleri daha iyi işleyebildiği belirtiliyor.
-
Ayrıca GPT-4, görsel girdi üzerinden metin çıktısını da destekliyor. OpenAI'nin verdiği örnekte bir görsel iletilip içeriğindeki "hangi kısmın komik olduğu" soruluyor. OpenAI de ilgili görselin mizahını analiz ederek açıklıyor. (Bu özellik şimdilik yalnızca araştırma önizlemesi olarak sunuluyor ve henüz herkese açık kullanıma açılmış değil.)
-
Bu GPT-4 modeliyle birlikte, GPT-3.5 döneminde yapay zekaya belirli bir rol vermek için kullanılan ifadeler
systemadlı ayrı bir alana konulabiliyor; böylece yapay zekanın tarzı ve görevi daha doğrudan tanımlanabiliyor. (OpenAI, bu kısmın "jailbreak" olarak adlandırılan içerik kısıtlamalarını aşma amacıyla kötüye kullanılabileceğinin de farkında.) -
GPT-4 hâlâ halüsinasyon sorununu yaşıyor. (Var olmayan şeyleri varmış gibi kabul edip akıl yürütme hataları üretmesi.) Ancak önceki modele kıyasla iç değerlendirmelerde yüzde 40 daha yüksek puan aldı.
-
GPT-4'ün hâlâ izin verilmeyen içerik üretme riski var; ancak GPT-3.5'e kıyasla ihlal niteliğindeki içerik üretim oranı yüzde 82 azaldı ve hassas taleplerde (tıbbi tavsiye, kendine zarar verme) politikalara uygun yanıt verme sıklığı yüzde 29 arttı.
-
Şu anda GPT-4 modeli, yalnızca ChatGPT Plus abonelerine 4 saatte 100 mesaj sınırıyla sunuluyor. OpenAI, bu sınırla bağlantılı ek ücretlendirme planları olduğunu ve uzun vadede ücretsiz kullanıcıların da erişebilmesini sağlamayı planladığını belirtti.
Bu özet, GPT-4'ün nasıl eğitildiğine, OpenAI Evals açıklamasına, ayrıntılı örneklere ve doğrudan benchmark'lara yer vermiyor; ayrıca başka önemli noktalar da eksik olabilir, bu nedenle lütfen asıl metne bakın.
10 yorum
3.5’te olduğu gibi kafadan sallayarak(?) yanıt verme durumu epey azalmış; bilmiyorsa bilmediğini dürüstçe söyleme eğiliminde.
Emekli olana kadar şu anki işimi yaparak geçinmek zor olacak gibi görünüyor.
Skynet çok da uzakta değil gibi..
GPT-4'ün gücü
https://www.clien.net/service/board/park/17962934
Çeşitli görseller var.
Yorumlarda, kız arkadaş küstüğünde onu gönlünü almak için 3.5 ile 4'ün verdiği yanıtların karşılaştırıldığı bir örnek var; aradaki fark oldukça büyük. haha
TensorFlow Korea grubunda paylaşılan, Lee Sang-hun'un GPT-4 Technical Report incelemesi
https://www.facebook.com/groups/TensorFlowKR/posts/1992265094447872
Çıkar çıkmaz GPT-4 ve GPT-3.5’e şöyle bir soru sordum.
GPT-3.5’in yanıtı ile GPT-4’ün yanıtı arasında çok net bir fark vardı. GPT-4, adım adım ilerleyip her dosyanın rolünü ayırıyor ve Godot editöründe gerçekten takip edildiğinde aynı sonuca ulaştıracak doğru yönergeleri veriyor; buna karşılık GPT-3.5, çalışıyormuş gibi görünen bozuk kodlar üretti.
Artık tek kişilik geliştiricilerin yaptığı oyunlar da ardı ardına çıkmaya başlayabilir sanırım... Oyun geliştirmek için her zamankinden daha iyi bir dönemdeyiz gibi görünüyor.
Elbette, seri üretim romanlar gibi seri üretim oyunlara dair endişeler de var ama... sonuçta AAA oyun şirketlerinin de çalışma ortamlarını büyük ölçüde değiştirip daha verimli ve daha yüksek kaliteli oyunları hatasız şekilde... iyi biçimde çıkarmalarını umuyorum.
Kendimi Luddist olasım geliyor... TT
Bundan sonra maaş alıp yaşayabilecek miyiz..
Roma'nın vatandaşı olmak için dua etmek gerek tabii, haha
Godot Engine olmasının sebebi, Unity'ye kıyasla kaynakların daha az olması nedeniyle test için daha uygun olacağını düşünmemdi. Genel olarak kaynak çok fazla olmadığında ne kadar yanıt verebildiğini merak ediyordum. Ama bunu fazlasıyla iyi yapınca şaşırdım....