6 puan yazan lemonmint 2024-12-06 | Henüz yorum yok. | WhatsApp'ta paylaş

Google, Gemma ailesinin en yeni görsel-dil modeli olan PaliGemma 2'yi duyurdu. PaliGemma 2, mevcut Gemma 2 modelini temel alıyor ve görüntüleri anlama ile onlarla etkileşim kurma yetenekleri ekleyerek çeşitli yapay zeka uygulamalarının olanaklarını genişletiyor.

  • Ölçeklenebilir performans: Farklı model boyutları (3B, 10B, 28B parametre) ve çözünürlükler (224px, 448px, 896px) sunarak çeşitli görevler için optimize edilmiş performans sağlıyor.
  • Uzun açıklama üretimi: Görseller için ayrıntılı ve bağlama uygun açıklamalar üretiyor; basit nesne tanımlamanın ötesine geçerek eylemleri, duyguları ve sahnenin genel hikayesini anlatıyor.
  • Yeni alanlara genişleme: Kimyasal formül tanıma, nota tanıma, uzamsal akıl yürütme ve göğüs röntgeni raporu oluşturma gibi çeşitli alanlarda güçlü performans gösteriyor.
  • Kolay yükseltme ve fine-tuning: Mevcut PaliGemma kullanıcıları kolayca yükseltme yapabiliyor ve modeli belirli görevler ile veri kümelerine uygun şekilde rahatça fine-tune edebiliyor.

Gemmaverse ekosisteminin genişlemesi:

PaliGemma'nın yayımlanmasının ardından Gemma ailesi, on binlerce model ve uygulamadan oluşan canlı bir ekosistem olan Gemmaverse'e hızla dönüştü. ColPali'nin görsel belge aramadaki ilerlemeleri, RoboFlow'un fine-tuning teknikleri ve gerçek zamanlı nesne takibindeki gelişmeler gibi çeşitli yenilikçi örnekler, Gemmaverse'ün potansiyelini gösteriyor.

Henüz yorum yok.

Henüz yorum yok.