PaliGemma 2 tanıtıldı
(developers.googleblog.com)Google, Gemma ailesinin en yeni görsel-dil modeli olan PaliGemma 2'yi duyurdu. PaliGemma 2, mevcut Gemma 2 modelini temel alıyor ve görüntüleri anlama ile onlarla etkileşim kurma yetenekleri ekleyerek çeşitli yapay zeka uygulamalarının olanaklarını genişletiyor.
- Ölçeklenebilir performans: Farklı model boyutları (3B, 10B, 28B parametre) ve çözünürlükler (224px, 448px, 896px) sunarak çeşitli görevler için optimize edilmiş performans sağlıyor.
- Uzun açıklama üretimi: Görseller için ayrıntılı ve bağlama uygun açıklamalar üretiyor; basit nesne tanımlamanın ötesine geçerek eylemleri, duyguları ve sahnenin genel hikayesini anlatıyor.
- Yeni alanlara genişleme: Kimyasal formül tanıma, nota tanıma, uzamsal akıl yürütme ve göğüs röntgeni raporu oluşturma gibi çeşitli alanlarda güçlü performans gösteriyor.
- Kolay yükseltme ve fine-tuning: Mevcut PaliGemma kullanıcıları kolayca yükseltme yapabiliyor ve modeli belirli görevler ile veri kümelerine uygun şekilde rahatça fine-tune edebiliyor.
Gemmaverse ekosisteminin genişlemesi:
PaliGemma'nın yayımlanmasının ardından Gemma ailesi, on binlerce model ve uygulamadan oluşan canlı bir ekosistem olan Gemmaverse'e hızla dönüştü. ColPali'nin görsel belge aramadaki ilerlemeleri, RoboFlow'un fine-tuning teknikleri ve gerçek zamanlı nesne takibindeki gelişmeler gibi çeşitli yenilikçi örnekler, Gemmaverse'ün potansiyelini gösteriyor.
Henüz yorum yok.