2 puan yazan GN⁺ 2023-07-12 | 1 yorum | WhatsApp'ta paylaş
  • GPT-4 ayrıntılarının sızmış olma ihtimali
  • Sızan bilgiler, GPT-4'ün gelişmiş özelliklere sahip olacağını gösteriyor
  • GPT-4'ün gelişmiş doğal dil işleme ve anlama yeteneklerine sahip olması bekleniyor
  • Sızan ayrıntılar ayrıca gelişmiş bağlam anlama ve akıl yürütme yeteneklerinden de söz ediyor
  • GPT-4'ün daha büyük bir model boyutuna sahip olacağı konuşuluyor; bu da performans artışına katkıda bulunabilir
  • Sızan bilgiler, teknolojiye hakim kişiler arasında heyecan yarattı
  • Bu makale, GPT-4'ün çeşitli sektörler ve uygulama alanları üzerindeki potansiyel etkisini tartışıyor
  • GPT-4'ün resmi olarak ne zaman yayımlanacağı bilinmiyor
  • Sızan ayrıntılar, yazılım mühendisleri ve teknoloji meraklıları arasında spekülasyon ve beklenti yarattı

1 yorum

 
GN⁺ 2023-07-12
Hacker News görüşleri
  • Sızdırılan GPT-4 ayrıntılarının asıl kaynağı, semianalysis.com’daki bir blog yazısıdır.
  • Ayrıntıları paylaşan Twitter kullanıcısı blog yazısını yeniden ifade etmiş gibi görünüyor; bu nedenle tweet silinmiştir.
  • GPT-4’te kullanılan MoE (Mixture of Experts) ilgi çekici ve çıktı kalitesindeki dalgalanmaları açıklayabilir.
  • GPT-4’ün görsel modeli açıklanmadı, ancak beklenti yüksek.
  • GPT-4’ün eğitimi için 21 yottaflops gerekti ve bu kayda değer bir hesaplama başarısıdır.
  • GPT-4’ün eğitim maliyeti geçen yıla göre 1/3 oranına düştü; bu da açık kaynak için iyi haber.
  • GPT-4’ün kalitesinin, spekülatif decoding modelinden düşük olasılıklı dizilerin kabul edilmesi nedeniyle düşmüş olabileceğine dair tahminler var.
  • Google, dil modeli ölçeklendirmesi için mixture of experts üzerinde çalışıyor ve GLaM modelinde 1,7 trilyon parametre ile 64 uzman bulunuyor.
  • George Hotz, bir röportajda GPT-4’ün 220 milyar parametreye sahip olduğunu ve 8 ağırlık setinden oluşan 16 karışım model olduğunu söyledi.
  • Twitter’ın yüksek API fiyatları nedeniyle Thread Reader gibi premium hizmetlerin hâlâ faaliyet gösterip gösteremeyeceğine dair merak var.
  • Bazı kullanıcılar, Twitter’a kayıt olmadan sızdırılan GPT-4 eğitim ayrıntılarına erişebilecekleri alternatif bağlantılar arıyor.
  • GPT-4’ün nasıl çalıştığına dair gerçek bilgiyi yalnızca OpenAI çalışanları biliyor; geri kalanın ise tahminlere dayanması gerekiyor.