3 puan yazan GN⁺ 2023-09-13 | 1 yorum | WhatsApp'ta paylaş
  • HN’de açık kaynak LLM’lerin ince ayarı konusuna ilgi hızla artıyor (ör. Anyscale’in gönderisi)
  • Model ince ayarına dair birkaç yıllık deneyim ve içgörülerin yanı sıra pratik kodlar paylaşılıyor
  • Veri etiketleme, ince ayar, verimli çıkarım çalıştırma, maliyet/performans değerlendirmesi gibi konuları kapsayan bir not defteri seti sunuluyor
  • Test setinde GPT-4’ün etiketleriyle %95 eşleşen bir 7B model eğitildi
  • İnce ayar nedir? Metinle talimat yazmaktan daha güçlü bir promptlama biçimi
  • İnce ayar modeli eğitmek için mevcut bir model, örnek girdi/çıktı çiftleriyle eğitiliyor
  • Promptlama ve ince ayarın artıları ve eksileri
  • İnce ayarın büyük avantajı: modelin davranışını yönlendirmede çok daha etkili olması, bu yüzden çok daha küçük bir modelin bile yeterli olabilmesi
  • İnce ayar yapılmış Llama 7B modeli, token başına GPT-3.5’ten 50 kat daha ucuz ve birçok kullanım senaryosunda aynı ya da daha iyi sonuç veriyor
  • Örnek: GPT-4 ile 2M tarif sınıflandırması $23k maliyete ulaşıyor, ancak bizim ince ayar yaptığımız model GPT-4’e benzer performans gösterirken tüm veri kümesini çalıştırmanın maliyeti yalnızca $19 oluyor
  • OpenPipe adlı açık kaynak bir ürün geliştiriliyor
  • OpenPipe ürünü, mühendislerin ince ayarı mümkün olduğunca basit şekilde benimsemesine yardımcı olmayı hedefliyor
  • Bu gönderi, ince ayar hakkında öğrenilenleri paylaşmak için hazırlanmış durumda

1 yorum

 
GN⁺ 2023-09-13
Hacker News görüşleri
  • GPT-3.5/4’e alternatif olarak Llama 2 model ince ayarı kullanımına dair bir yazı
  • Bazı kullanıcılar çeviri işlerinde GPT-3.5’in Llama 2’den 100 kat daha ucuz olduğunu gördü; Llama 7B ise kötü çeviriler üretiyor
  • OpenAI’nin GPT-3.5 için agresif fiyatlandırma stratejisinin, diğer sağlayıcılar yerine kendi modellerine bağımlılığı teşvik etmeyi amaçladığı tahmin ediliyor
  • GPT ve diğer LLM’lerin çıktılarının şirket içi ikame modeller eğitmek için kullanılma olasılığı tartışılıyor; bunun üretim ölçeğinde normal API kullananlar için maliyet açısından verimli bir çözüm olabileceği belirtiliyor
  • İnce ayarlı Llama 7B modelinin GPT-3.5’ten 50 kat daha ucuz olduğu iddiası sorgulanıyor; bazı kullanıcılar bunun ancak self-hosting ile mümkün olabileceğini öne sürüyor
  • İnce ayarın etkililiğine kıyasla low-rank adaptation hakkında soru işaretleri dile getiriliyor
  • Bazı kullanıcılar, ince ayarlı Llama modelleri ile GPT-3.5 arasındaki karşılaştırmanın yanıltıcı olduğunu; uygun çıkarım gecikmesi ve ölçeklenebilirlik sorunlarını gerekçe göstererek savunuyor
  • İnce ayarlı Llama 2 modelinin kalitesi mutlaka ChatGPT’den üstün değil; ince ayar yüksek kaliteli veri setleri gerektiriyor ve bunları oluşturmak kolay değil
  • GPT function calling’in tutarlılığı ve hata oranı hakkında soru işaretleri var
  • Kullanıcılar kendi modellerini ince ayar yapmak için en iyi açık kaynak LLM’nin hangisi olduğunu merak ediyor
  • İnce ayar veri setinin girdi/çıktı çiftlerinden mi oluşması gerektiği, yoksa otoregresif de olup olamayacağı konusunda açıklık isteniyor
  • Kullanıcılar bu modellerin nasıl ince ayarlandığını öğrenebilecekleri kaynaklarla, özellikle yeni başlayanlara yönelik olanlarla ilgileniyor
  • Bu yazı, ML/LLM alanına yeni başlayanlar için değerli bir kaynak olarak görülüyor.