Sam Altman ve Greg Brockman'dan OpenAI Safety araştırmacısının iddialarına geri bildirim
(twitter.com/gdb)-
Jan'ın katkılarına teşekkür ve stratejinin açıklanması
- Jan'ın katkıları için teşekkür ediliyor ve dışarıdan da misyona katkı sunmayı sürdüreceğine inanılıyor.
- Onun ayrılığının gündeme getirdiği sorular hakkında stratejilerini açıklamak istiyorlar.
-
AGI'nin risk ve fırsatlarına dair farkındalığın artırılması
- Dünyanın daha iyi hazırlanabilmesi için AGI'nin risk ve fırsatlarına dair farkındalık artırılıyor.
- Derin öğrenmenin ölçeklenebilirliği defalarca gösterildi ve bunun anlamı analiz edildi.
- AGI için uluslararası yönetişim çağrısı yapıldı; bu, o dönemde popüler olmayan bir konuydu.
- Yapay zeka sistemlerinin felaket düzeyindeki risklerini değerlendirme biliminin öncülüğü yapıldı.
-
Güvenli sistem dağıtımının temelinin atılması
- Giderek daha yetenekli sistemlerin güvenli biçimde dağıtılabilmesi için temel hazırlanıyor.
- Yeni bir teknolojiyi ilk kez güvenli hâle getirmek kolay bir iş değil.
- GPT-4'ü dünyaya güvenli şekilde sunmak için çok sayıda çalışma yapıldı.
- Dağıtımdan edinilen derslere dayanarak model davranışı ve kötüye kullanım izleme sürekli iyileştiriliyor.
-
Gelecekteki zorluklar
- Gelecek, geçmişten daha zor olacak.
- Yeni modellerin önemine uygun şekilde güvenlik çalışmaları yükseltilmeye devam edilmeli.
- Bu, geçen yıl kullanıma alınan Preparedness Framework ile sistematik hâle getirildi.
-
Geleceğe bakış
- Modeller daha güçlü hâle geldikçe dünyayla daha derin biçimde entegre olacakları öngörülüyor.
- Kullanıcılar yalnızca tek bir modelle ve metin giriş-çıkışıyla konuşmayacak; çok sayıda multimodal model ve araçtan oluşan sistemlerle etkileşime girecek.
-
Güvenli ve faydalı sistemlerin geliştirilmesi
- Bu tür sistemlerin insanlara çok faydalı ve yardımcı olacağına, ayrıca güvenli biçimde sunulabileceğine inanılıyor.
- Bunun için çok sayıda temel çalışma gerekiyor.
- Buna, eğitim sırasında birbirine bağlanan unsurların dikkatle değerlendirilmesi ve ölçeklenebilir denetim gibi zor problemlere çözüm bulunması da dahil.
- Bu doğrultuda inşa etmeyi sürdürürken, çıkış güvenliği standartlarına ne zaman ulaşılacağı henüz bilinmiyor; ancak lansman takviminin gecikmesi sorun değil.
-
Geri bildirim döngüsü ve kapsamlı testler
- Olası tüm gelecek senaryolarını hayal etmenin mümkün olmadığı kabul ediliyor.
- Çok sıkı geri bildirim döngüleri, kapsamlı testler, her adımda dikkatli değerlendirme, dünya standartlarında güvenlik ve emniyet ile yetenek arasında denge gerekiyor.
- Farklı zaman ufuklarında güvenlik araştırmaları sürdürülmeye devam edilecek.
- Hükümetler ve çeşitli paydaşlarla iş birliği sürdürülecek.
-
AGI'ye giden yolu anlama
- AGI'ye giden yolu keşfetmek için kanıtlanmış bir oyun kitabı yok.
- Ampirik anlayış, ileriye dönük yolu belirlemeye yardımcı olacak.
- Muazzam faydalar sunarken ciddi riskleri azaltma çalışmaları yürütülüyor.
- Rolleri son derece ciddiye alıyorlar ve kendi eylemlerine yönelik geri bildirimleri dikkatle inceliyorlar.
1 yorum
Hacker News görüşü
Hacker News yorumları derleme özeti
Yapay zekanın risklerine dair endişeler
Büyük şirketlerde risk azaltma
LLM'lerin faydası ve sınırları
Yapay zekanın gerçek riskleri
Yapay zeka hizalama ve etik
Şirketlerin dil kullanımına güvensizlik