MIT araştırmacıları, büyük dil modellerinin bilgiye erişim tekniğini ortaya koydu
- Büyük dil modellerinin, kullanıcının istemlerine yanıt verirken depolanmış bilgiyi geri getirmek için basit bir mekanizma kullandığı bulundu.
- Araştırmacılar, bu basit mekanizmadan yararlanarak modelin çeşitli konular hakkında ne bildiğini belirleyebiliyor ve yanlış depolanmış bilgileri düzeltebiliyor.
Büyük dil modellerinin karmaşıklığı
- Büyük dil modelleri müşteri desteği, kod üretimi, dil çevirisi gibi çeşitli alanlarda kullanılıyor, ancak nasıl çalıştıkları tam olarak anlaşılmış değil.
- MIT ve diğer kurumlardan araştırmacılar, bu dev makine öğrenimi modellerinin depolanmış bilgiyi geri getirme mekanizmasını inceledi.
Bilginin basit geri getirme mekanizması
- Araştırma sonucunda, büyük dil modellerinin depolanmış gerçekleri geri kazanmak ve çözümlemek için çoğu zaman basit bir doğrusal fonksiyon kullandığı görüldü.
- Model, benzer türdeki gerçekler için aynı çözümleme fonksiyonunu kullanıyor.
- Doğrusal fonksiyon, iki değişken arasındaki doğrusal ilişkiyi gösteren bir denklemdir.
Modelin ne bildiğini keşfetmek
- Araştırmacılar, çeşitli gerçeklere ilişkin doğrusal fonksiyonları belirleyerek modelin yeni konular hakkında ne bildiğini araştırdı ve bu bilginin model içinde nerede depolandığını doğruladı.
- Geliştirilen teknikle tahmin edilen basit fonksiyonlar sayesinde, model yanlış yanıt verdiğinde bile çoğu zaman doğru bilgiyi içinde barındırdığı ortaya çıktı.
Model bilgisinin görselleştirilmesi
- Araştırmacılar, bu fonksiyonları kullanarak modelin farklı konular hakkında neyi doğru kabul ettiğini belirledi.
- Örneğin, "Bill Bradley was a" istemiyle başlayıp "plays sports" ve "attended university" için çözümleme fonksiyonlarını kullanarak modelin Sen. Bradley'nin bir basketbol oyuncusu olduğunu ve Princeton University'de okuduğunu bilip bilmediğini kontrol ettiler.
- Bu keşif tekniğiyle, belirli ilişkiler hakkındaki bilginin dönüştürücünün farklı katmanlarında nerede depolandığını görselleştiren ve "attribute lens" olarak adlandırılan bir ızgara oluşturuldu.
GN⁺ görüşü
- Bu araştırma, büyük dil modellerinin olgusal bilgiyi nasıl depolayıp geri getirdiğine dair anlayışı bir adım ileri taşıyor.
- Bulgular, modelin yanlış bilgi verme eğilimini azaltmak için bilgiyi düzeltme ve yapay zeka sohbet botlarındaki hataları önleme olasılığını gösteriyor.
- Bu teknolojinin uygulanması, yapay zekanın güvenilirliğini artırmaya katkı sağlayabilir ve kullanıcı deneyimini iyileştirmeye yardımcı olabilir.
- Ancak tüm gerçeklerin doğrusal olarak kodlanmadığı göz önüne alındığında, bu tekniğin her tür bilgi geri getirme sürecine uygulanıp uygulanamayacağı konusunda daha fazla araştırmaya ihtiyaç var.
- Benzer işlevler sunan açık kaynak projeler arasında Google'ın BERT'i ve OpenAI'nin GPT serisi yer alıyor; bunlar da büyük dil modellerinin çalışma prensiplerini anlamaya katkı sağlıyor.
- Yeni bir teknoloji benimsenirken modelin karmaşıklığı ile yorumlanabilirliği arasındaki denge dikkate alınmalı; bu tekniğin seçilmesiyle elde edilebilecek fayda ise model doğruluğu ve güvenilirliğinin artması olacaktır.
1 yorum
Hacker News yorumu
Bu dikkat çekici çalışma, günümüzde yapay zeka alanındaki en büyük sorunlardan bazılarını öne çıkarıyor
Dilin yapısı, Word2Vec'i mümkün kılıyor
Mementofilminin kahramanı gibi olmasıdırGerçeklerin doğrusal fonksiyonlar olarak depolanmasının ne anlama geldiğini anlamaya yardımcı oluyor
Programlama bilgisini kodlamak için kullanılan fonksiyon türlerine dair merak
Word2Vec'teki ilişki vektörlerinin yaptıklarına benzer olduğu fark ediliyor
LLM, iyi bir sıkıştırma mekanizması gibi görünüyor
"King - Man + Woman = Queen" embedding örneğini hatırlatıyor
7 milyar "parametreye" sahip bir "CSV dosyası/veritabanı/modelin" nasıl olup da neredeyse her konuda bilgili, etkileşimli bir LLM/GPT sunduğunu anlamak zor
Bu makalenin harika olduğu ve bu fikirleri doğrulamak için deneyler yapılmış olması beğeniliyor
Muhakeme kısmını bilgi kısmından ayırma olasılığı