ChatGPT 3.5 hata mesajının nedeni
- OpenAI'nin GPT modeli, karakterler yerine birden fazla karakterden oluşan "token"lar üretir.
- Bu token üretim yöntemi, modelin performansını ve doğruluğunu artırır.
richTextPanel, source, loadPath adlı üç token vardır ve bunlar birbiriyle değiştirilebilir durumdadır.
loadPath tokenı, GitHub'da 80.4k dosyada XML yapılandırma dosyalarında bir seçenek adı olarak kullanılır.
loadPath tokenının bağımsız bir tokena dönüşmüş olmasının nedeni muhtemelen "R a lative" yazım hatasıdır.
- OpenAI, token listesini oluşturduktan sonra XML dosyalarını eğitim verisinden hariç tutmaya karar vermiş olabilir; bu nedenle
loadPath tokenının eğitim verisindeki kullanımı neredeyse hiç olmamış olabilir.
- Sonuç olarak model,
useRalativeImagePath tokenının kullanımını anlayacak şekilde eğitilmemiştir ve geçersiz tokenlar üretir.
Veri zehirleme için kullanım?
- GPT-3.5 ile belgeleri özetleme girişimlerini bozmak için bu ifadeyi belgelere yerleştirmek mümkün olabilir.
Ek okuma
- Bu konuyu araştırmak için yararlı bazı gönderiler bulunuyor.
GN⁺ yorumu
- Bu yazıdaki en önemli nokta, GPT modelinin belirli tokenlar için neden hatalı çıktı ürettiğini anlamaktır.
- Bu bilgi, yapay zeka modellerinin nasıl çalıştığını ve sınırlarını anlamaya yardımcı olur.
- Ayrıca bu yazı, veri zehirleme veya yapay zeka modellerinin zayıflıklarından yararlanma yöntemlerine dair ilginç bir örnek sunuyor.
1 yorum
Hacker News görüşleri
Glitch token'lara dair açıklama
Hollanda'da II. Dünya Savaşı sırasında dil doğrulama yöntemi
Scheveningenkelimesinin telaffuzu kullanılıyordu.LLM token üretim sürecine dair açıklama
useRalativeImagePathtoken'ını anlamadığı için geçersiz token'lar üretmesi, LLM'lerin token üretme biçimi değildir.Glitch token'ların olası nedenlerine dair analiz
Model çıktısına dair farklı bir bakış açısı
useRalativeImagePathtoken'ını görünce rastgele üretime giden bir spiral başlatabilir ya da tutarlı metni korumaya çalışabilir.LLM eğitim verileri için gelecekteki etkiler
GPT-4'te yaşanan başarısızlık deneyiminin paylaşılması
Girdi verisinin kalitesine dair düşünceler
GPT-3.5 özetlemeyi bozmak için belirli ifadeler kullanma önerisi
RTCatchveredirectToRoutekelimeleri hakkındaki kafa karışıklığıRTCatchileredirectToRoute'un aynı kelime sanılabileceği bir durum olup olmadığı soruluyor.RTCatchhakkında merak dile getiriliyor ve ek bilgi isteniyor.