LLM'lerde Belirsizlik Tespit Teknolojisi
(thariq.io)LLM'lerde Belirsizlik Tespiti
Bu yazı, XJDR'nin Entropix adlı yeni projesinde geliştirilen yeni bir akıl yürütme tekniğini açıklıyor. Entropix, belirsiz anlarda örneklemeyi daha akıllı hale getirerek modelin akıl yürütmesini iyileştirmeye çalışıyor. Ancak henüz büyük ölçekli bir değerlendirme yapılmadığı için gerçekte ne kadar yardımcı olduğu belirsiz.
Belirsizliğe Genel Bakış
- Örnekleme, LLM'in seçebileceği olası tokenların dağılımından (
logits) token seçme sürecidir. - Modelin tahminine ne kadar güvendiği bu dağılım üzerinden anlaşılabilir.
- Entropix, model belirsiz olduğunda daha iyi kararlar vermesini sağlamak için uyarlamalı örnekleme kullanır.
Belirsizliğin Anlamı ve Önemi
logitsiçindeki belirsizliğin çeşitli nedenleri olabilir ve bunların hepsi kötü değildir.- Nedenler arasında eş anlamlılar veya eşdeğer tokenlar, dallanan yollar ve yapay zekanın emin olmadığı durumlar bulunur.
- Entropix, belirsizliğin derecesine göre bir sonraki tokenın farklı yöntemlerle seçilmesi gerektiğini öne sürer.
Entropi ve Varyentropi
- Entropix, belirsizliği ölçmek için iki gösterge kullanır: entropi ve varyentropi.
- Entropi, tahmin edilen
logitsdeğerlerinin birbirinden ne kadar farklı olduğunu ölçer. - Varyentropi, belirsizliğin "biçimini" gösterir; yüksek varyentropi, bazı değerlerin diğerlerinden büyük ölçüde farklı olduğunu ifade eder.
Matematiksel Açıklama
- Surprisal, bir olayın ne kadar öngörülemez olduğunu ölçen bir kavramdır.
- Entropi, tüm olası sonuçlar için surprisal'ın beklenen değeridir.
- Varyentropi, surprisal'ın varyansı olarak hesaplanır.
Entropi ve Varyentropiye Dayalı Uyarlamalı Örnekleme
Düşük entropi, düşük varyentropi
- Modelin yalnızca ilk seçeneğe değil, diğer seçeneklere de güvendiği ideal durumdur.
- En yüksek olasılıklı tokenı seçmek için standart argmax örneklemesi kullanılır.
Düşük entropi, yüksek varyentropi
- Modelin birkaç seçeneğe çok yüksek olasılık verdiği durumdur.
- Bu, yeni bir çıktı dalını gösterebilir ve dallanma birden fazla şekilde uygulanabilir.
Yüksek entropi, düşük varyentropi
- Model ya tanımadığı bir şeyle karşı karşıyadır ya da tüm seçenekler birbirinin yerine geçebilir durumdadır.
- "Düşün" tokenı kullanılarak modelin daha fazla hesaplama zamanı harcaması teşvik edilir.
Yüksek entropi, yüksek varyentropi
- Modelin net bir tercihi yoktur ama bazı çıktılara diğerlerinden daha fazla güvenmektedir.
- Rastgele seçim yapılabilir ya da dallanma ve düşün tokenı eklenebilir.
Dallanma ve Düşün Tokenı
- Dallanma tahmini, birkaç
logitsdeğerini izleyip bunların farklı tokenlara nasıl gittiğine bakma yöntemidir. - Düşün tokenı, belirsizlik durumunda daha fazla hesaplama yapmanın bir yoludur.
Dikkat Entropisi
- Entropix, sıcaklığı ayarlamak için dikkat entropisini kullanır.
- Dikkat entropisi ve dikkat uyumu, örnekleme için ek sinyaller sağlayabilir.
Bu Neden Önemli?
- Entropix'in içgörüleri anlaşılması kolay ve tamamen yeni değil.
- Değerlendirmeler büyük fayda göstermese bile, bu tür akıl yürütme teknikleri deney yapmak için kolay bir yön sunuyor.
GN⁺ Özeti
- Entropix, LLM'lerdeki belirsizliği ele almak için yeni bir yaklaşım öneriyor.
- Entropi ve varyentropi kullanarak modelin güven düzeyini ölçüyor ve uyarlamalı örneklemeyle daha iyi kararlar alınmasını sağlayabiliyor.
- Bu teknikler, büyük bütçeler olmadan da açık kaynak geliştiricilerinin modellerin akıl yürütme yeteneklerini geliştirebilmesi için bir olasılık sunuyor.
- Benzer işlevlere sahip projeler arasında Hugging Face'in Transformers'ı öneriliyor.
1 yorum
Hacker News görüşü
Charles Babbage, yanlış girdilerin doğru çıktılar üretip üretemeyeceği sorusu karşısında kafa karışıklığı yaşıyordu
Tüketici donanımıyla kullanılan örnekleme tabanlı teknikler, SOTA modelleri iyileştirmek için nadir bir fırsat sunuyor. Ancak bu kalıcı olmayacak ve nihayetinde eğitilebilir örnekleyicilere ihtiyaç duyulacak
optillm, bu tür teknikleri uygulayan bir projeLLM'lerdeki birçok sorun, anlam sızıntısı veya ilgisiz bilgilerden kaynaklanıyor. Dikkat mekanizmasında iyileştirme payı olabilir
Modern GPT'ler, token söz dağarcığı üzerinde çalışan büyük bir sınıflandırıcıdan logit çıktıları üretir. Bu, uzay içinde yer alır ve alışılmadık dışbükeylik özelliklerine sahip manifoldlar hesaplayabilir
Yüksek entropili durumlarda modelin belirsizliği tespit edip kullanıcıyı uyarabilen bir özelliğe ihtiyaç var
LLM belirsizliğini değerlendiren tekniklerin varlığından emin değilim. Son araştırmalar, LLM'in tahmin yürütüp yürütmediğini istatistiksel olarak nicelendirmek için semantik entropi kullanıyor
Modelin belirsizliğe izin verilmediğinde verdiği çıktıyı deneyen biri olup olmadığını merak ediyorum. Bu, tüm token'lar eşik değerin üzerinde kesinliğe ulaşana kadar örnekleyicinin geri sardığı bir yöntem
LLM'lere güvenip işleri asgari gözetimle yaptırma konusunda şüpheler var. Her şey bir "halüsinasyon" ya da tahmin olabilir
LLM'lerin sorunu yalnızca "belirsizlik" değil; bunun birçok boyutu var. Sorunun nedeni, sorunun anlamca yetersiz olması, bilgi eksikliği, uzmanlar arasında uzlaşı bulunmaması gibi farklı etkenler olabilir
Dil modelleri için sayısız örnekleme stratejisi var. Belirli bir örnekleme stratejisinin standart top-k veya top-p örneklemesinden üstün olduğunu ampirik olarak göstermek zor