Google Gemma 3 270M: Süper verimli yapay zeka için kompakt model tanıtıldı

(developers.googleblog.com)

4 puan yazan GN⁺ 2025-08-15 | Henüz yorum yok. | WhatsApp'ta paylaş

Gemma 3 270M, 270 milyon parametreli hafif bir model olup güçlü komut takip etme yeteneği ve metin yapılandırma özellikleri sunuyor
256k tokenlik geniş kelime dağarcığı sayesinde nadir token’ları işlemede güçlü; belirli alanlara ve dillere uyarlanmış fine-tuning tabanlı bir model olarak tasarlandı
Pixel 9 Pro SoC üzerinde INT4 kuantize modelin 25 sohbet boyunca yalnızca %0,75 pil tüketmesi gibi etkileyici bir enerji verimliliği sunuyor
Büyük genel amaçlı modeller yerine çok sayıda küçük ve uzmanlaşmış model çalıştırarak hız, maliyet ve doğruluğu aynı anda sağlama stratejisine uygun
Cihaz üzerinde çalışma, hızlı yinelemeli denemeler ve düşük maliyetli işletim gerektiren sabit görevler için optimize edildiğinden çeşitli yapay zeka uygulamaları geliştirmeyi mümkün kılıyor

Gemma 3 270M’ye genel bakış

Google’ın Gemma 3 ve Gemma 3 QAT’in ardından yeni duyurduğu küçük, uzmanlaşmış fine-tuning modeli
270M parametrenin 170 milyonu embedding’e, 100 milyonu ise transformer bloklarına ayrılmış durumda
256k token içeren geniş kelime dağarcığıyla nadir ve özel token’ları işleyebiliyor
Hem ön eğitimli (pretrained) hem de komut ayarlı (instruction-tuned) sürümler sunuluyor

Kompakt ama güçlü yapı: Belirli alanlara/dillere özel fine-tuning için ideal
Aşırı enerji verimliliği: Pixel 9 Pro SoC’de INT4 model, 25 sohbet için yalnızca %0,75 pil kullanıyor
Komut takip yeteneği: Genel amaçlı sohbetten çok görev odaklı kullanıma optimize edildi; temel durumda bile komutları yerine getirebiliyor
Kuantizasyon desteği (QAT): INT4 hassasiyette performans kaybını en aza indiriyor, kaynak kısıtlı ortamlar için uygun

Yapay zeka tasarımında verimlilik odaklı yaklaşımı vurguluyor
Küçük modellerle hızlı yanıt ve düşük maliyetli işletim mümkün
Metin sınıflandırma, veri çıkarımı gibi net tanımlı görevlerde uzmanlaştırıldığında yüksek performans gösteriyor

Adaptive ML, SK Telecom’un çok dilli içerik moderasyonu için Gemma 3 4B modelini fine-tuning uygulayarak büyük ölçekli özel modellere kıyasla daha iyi performans elde etti
270M model, bu yaklaşımı daha küçük ölçekte genişleterek uzmanlaşmış görev grupları için çok sayıda ‘uzman modelin’ üretilmesini mümkün kılıyor
Hugging Face’in web tabanlı Bedtime Story Generator uygulaması, Gemma 3 270M sayesinde çevrimdışı ya da web tarayıcısı içinde gerçek zamanlı içerik üretebiliyor

Net ve yüksek hacimli görev işleme: Duygu analizi, varlık çıkarımı, sorgu yönlendirme, metin dönüştürme, yaratıcı üretim, uyumluluk denetimi gibi alanlara özel görevler için ideal
En iyi ekonomi ve hız: Hafif altyapıda veya cihaz üzerinde çok düşük maliyetle çalıştırılabilir, anında yanıt verebilir
Hızlı geliştirme ve dağıtım: Model boyutu küçük olduğundan fine-tuning denemeleri ve optimizasyon/test süreçleri saatler içinde tamamlanabilir
Gizlilik koruması: Buluta veri göndermeden cihaz üzerinde işleme yapılabilir, bu da hassas bilgileri korumada avantaj sağlar
Özelleştirilmiş uzman modellerin işletimi: Bütçe baskısı olmadan farklı amaçlara yönelik modeller aynı anda kurulup dağıtılabilir

Model; Hugging Face, Ollama, Kaggle, LM Studio, Docker gibi platformlardan indirilebiliyor
Vertex AI, llama.cpp, Gemma.cpp, LiteRT, Keras, MLX gibi çeşitli çıkarım araçlarını destekliyor
Hugging Face, UnSloth ve JAX tabanlı tam fine-tuning kılavuzları sunuluyor
Yerel ortamdan Google Cloud Run’a kadar esnek dağıtım mümkün

Gemma 3 270M, küçük ama güçlü bir temel model olarak belirli görevlere optimize edilmiş yapay zeka çözümlerinin geliştirilmesini hızlandırıyor
Düşük maliyet, yüksek verimlilik ve hızlı dağıtımı aynı anda isteyen geliştiriciler için ideal bir seçenek