Meta Llama 3.2’yi duyurdu - açık özelleştirilebilir modellerle edge AI ve görsel yapay zekayı dönüştüren teknoloji
(ai.meta.com)-
Meta, Llama 3.2’yi duyurdu
- Küçük ve orta ölçekli görsel LLM’ler (11B ve 90B) ile hafif, yalnızca metin odaklı modelleri (1B ve 3B) içeriyor
- Qualcomm ve MediaTek donanımlarında kullanılabiliyor ve Arm işlemciler için optimize edildi
- Özetleme, yönerge takibi ve yeniden yazma görevleri için uygun modeller
-
Llama 3.2 modellerinin özellikleri
- 11B ve 90B görsel modeller, görüntü anlama görevlerinde öne çıkıyor
torchtunekullanılarak özelleştirilmiş uygulamalar için ince ayar yapılabiliyortorchchatile yerel dağıtım mümkün- Meta AI akıllı asistanı üzerinden kullanılabiliyor
-
Llama Stack dağıtımı
- Tek düğüm, şirket içi, bulut ve cihaz üstü ortamlarda Llama modelleriyle çalışmayı basitleştiriyor
- AWS, Databricks, Dell Technologies, Fireworks, Infosys ve Together AI ile iş birliği içinde dağıtılıyor
-
Llama 3.2 modellerini indirme
- llama.com ve Hugging Face üzerinden indirilebiliyor
- AMD, AWS, Databricks, Dell, Google Cloud, Groq, IBM, Intel, Microsoft Azure, NVIDIA, Oracle Cloud, Snowflake ve diğer partner platformlarda hemen geliştirmeye başlanabiliyor
-
Llama 3.2’nin performansı
- 11B ve 90B modeller; belge düzeyinde anlama, görsel açıklama oluşturma ve görsele dayalı görevler için uygun
- 1B ve 3B modeller, çok dilli metin üretimi ve araç çağırma yetenekleri sunuyor
- Yerelde çalıştırıldığında anlık yanıt ve yüksek gizlilik sağlıyor
-
Model değerlendirmesi
- 150’den fazla benchmark veri kümesinde performans değerlendirmesi yapıldı
- Claude 3 Haiku ve GPT4o-mini ile rekabet edebilecek performans sunuyor
-
Görsel modeller
- Görüntü girdisi desteği için yeni bir model mimarisi sunuluyor
- Yalnızca metin yeteneklerini korurken görüntü ve metin prompt’larını birleştirerek derinlemesine anlama ve akıl yürütme sağlıyor
-
Hafif modeller
- Budama ve bilgi damıtma yöntemleri kullanılarak 1B ve 3B modeller geliştirildi
- Yerelde verimli şekilde çalıştırılabiliyor
-
Llama Stack dağıtımı
- Llama Stack API aracılığıyla standartlaştırılmış bir arayüz sunuyor
- Farklı ortamlarda Llama modelleriyle çalışmayı basitleştiriyor
-
Sistem düzeyinde güvenlik
- Llama Guard 3 11B Vision duyuruldu
- Llama Guard 3 1B modeli, dağıtım maliyetlerini önemli ölçüde azaltıyor
-
Llama 3.2 kullanımı
- Geliştiricilere ihtiyaç duydukları araç ve kaynakları sağlıyor
- Llama 3.2 ve Llama Stack ile yenilikçi uygulamalar geliştirilebiliyor
GN⁺ özeti
- Llama 3.2, edge ve mobil cihazlarda çalışabilen hafif modeller dahil olmak üzere çeşitli görsel ve metin modelleri sunuyor
- Qualcomm, MediaTek ve Arm gibi şirketlerle yapılan iş birlikleri sayesinde farklı donanımlarda optimize performans sağlıyor
- Llama Stack dağıtımı ile geliştiricilerin farklı ortamlarda Llama modellerini kolayca kullanabilmesi destekleniyor
- Llama 3.2, yüksek gizlilik ve anlık yanıt sunarak yerel uygulama geliştirme için uygun hale geliyor
- Claude 3 Haiku ve GPT4o-mini ile rekabet edebilecek performans sağlıyor ve çeşitli benchmark’larda güçlü sonuçlar gösteriyor
1 yorum
Hacker News görüşleri
Yeni 1B modelinin performansı şaşırtıcı. İndirme boyutu 1.3GB
"The Llama jumped over the ______!" örneğinde 1-hot encoding ile doğru yanıtın %100 olasılıkla "wall" olduğu görülüyor
Meta'nın Llama ekibinin açıklığına hayran kaldım. Sadece modele erişimi değil, nasıl inşa edildiğini de paylaşıyorlar
Acemi sorusu: İnsan bilgisini gerektirmeyen ama yazılım mühendisliği becerisi 10 kat olan bir modele ihtiyacım var. Böyle bir model olup olmadığını merak ediyorum
Ollama'da 3B modeli denedim. Optik, biyoloji ve Rust hakkında sorulara hızlı yanıt veriyor ve geniş bilgiye sahip
Ollama blog yazısı: bağlantı
llama3.2:3b-instruct-q8_0 modeli, 3.1 8b-q4'ten daha iyi performans gösteriyor. MacBook Pro M1 üzerinde daha hızlı ve sonuçları da daha iyi
Ollama için bir web UI istemcisi önerebilecek biri var mı diye soruluyor
Güncel LLM benchmark'larını içeren bir leaderboard olup olmadığı soruluyor
3B model multimodal (Norveççe) kullanımda oldukça iyiydi ama bazen çok fazla anlamsız yanıt üretiyor. 8B'den daha hassas ama Gemma 2 2B'den daha kullanılabilir