- Google’ın açık kaynak modeli Gemma 4, iPhone’da internet bağlantısı olmadan yerel olarak çalışarak tamamen çevrimdışı çıkarım gerçekleştirebiliyor
- Gemma 4’ün 31B modeli, Qwen 3.5’in 27B modeliyle benzer performans gösterirken yaklaşık 4 milyar daha fazla parametreye sahip
- E2B·E4B varyantları, hız ve ısınma kontrolü için optimize edilmiş mobil modeller olarak öne çıkıyor; Google uygulaması varsayılan olarak E2B kullanımını öneriyor
- Kullanıcılar Google AI Edge Gallery uygulaması üzerinden model seçip API veya bulut olmadan cihaz içinde çıkarım çalıştırabiliyor
- Bu çalışma, cihaz üstü yapay zekaya geçişin gerçeğe dönüştüğünü gösterirken, edge AI ekosisteminin genişlemesi açısından önemli bir dönüm noktası olarak değerlendiriliyor
iPhone’da Google Gemma 4’ün cihaz üstü çalıştırılması
- Google’ın açık kaynak modeli Gemma 4, iPhone’da tamamen çevrimdışı çıkarımı destekliyor ve yerel olarak çalışıyor
- İnternet bağlantısı olmadan yerel çıkarım yapılabiliyor
- Edge AI dağıtımı, geleceğe ait bir hedef olmaktan çıkıp şu anda gerçekleşen bir teknik gerçekliğe dönüşüyor
- Performans karşılaştırmasında, Gemma 4’ün 31B varyantı Qwen 3.5’in 27B modeliyle benzer seviyede değerlendiriliyor
- Gemma, yaklaşık 4 milyar daha fazla parametreye sahip
- Her iki modelin de göreve göre farklı güçlü yönleri bulunduğundan mutlak bir üstünlük yok
- Mobil için optimize edilmiş modeller olan E2B ve E4B varyantları dikkat çekiyor
- Verimliliğe odaklanarak hız, hafiflik ve ısınma kontrolü açısından avantaj sağlıyorlar
- Google’ın uygulaması varsayılan olarak E2B kullanımını öneriyor
- Google AI Edge Gallery uygulaması App Store’dan indirilip hemen çalıştırılabiliyor
- Kullanıcılar model varyantını seçerek doğrudan cihaz üzerinde çıkarım yapabiliyor
- API çağrısı veya bulut bağımlılığı yok
- Uygulama, basit bir metin arayüzünün ötesinde görüntü tanıma, sesli etkileşim ve genişletilebilir Skills çerçevesi içeriyor
- Cihaz üstü yapay zeka deney platformu olarak tasarlandığı için geliştiriciler ve ileri düzey kullanıcılar tarafından kullanılabiliyor
Teknik yapı ve performans
- Gemma 4, iPhone’un GPU’su üzerinden çıkarım yolunu kullanıyor
- Çok düşük yanıt gecikmesiyle tüketici donanımında da yüksek performanslı yapay zeka iş yüklerinin işlenebileceğini kanıtlıyor
- Yerel yapay zeka dağıtımının ticarileşme potansiyelini gösteren önemli bir örnek olarak değerlendiriliyor
- Çevrimdışı işlevler, kurumsal ortamlardaki kullanım alanını büyük ölçüde genişletiyor
- Saha çalışmaları, sağlık ortamları ve veri gizliliğinin kritik olduğu alanlarda buluta bağımlı olmadan kullanılabiliyor
Anlamı ve gelecek perspektifi
- Gemma 4’ün iPhone’da çalıştırılması, basit bir teknik gösteri değil; cihaz üstü yapay zeka çağının gelişini simgeliyor
- Google, Gemma aracılığıyla edge AI ekosistemini genişletmeyi ciddi biçimde hızlandırıyor
- “Gemma artık şişeden çıktı” ifadesinde olduğu gibi, yapay zekanın yerelleşmesine yönelik dönüşüm zaten başlamış durumda
1 yorum
Hacker News yorumları
Yazının üslubu sanki bir LLM yazmış gibi hissettirmiş
“It’s not mere X — it’s Y” gibi kalıpların birkaç kez tekrarlandığı söylenmiş
Çıkarımın Apple Neural Engine yerine GPU üzerinden yapıldığı fark edilmiş
Google mühendislerinin Apple’ın özel tensor blokları için custom kernel derlemeyi bırakmış olabileceği söylenmiş. Metal taşımayı kolaylaştırıyor ama bataryayı fazla tüketiyor. ANE backend’i yeniden yazılana kadar bunun ancak basit bir teknik demo olduğu yorumu yapılmış
Gemma 4 ile çevrimdışı bir kodlama uygulaması (
pucky) yapılıp iPhone’da çalıştırılmışGitHub bağlantısına bakılması önerilmiş. 4B modelin de çalıştığı ama bellek kısıtları nedeniyle varsayılanın 2B olduğu belirtilmiş. TypeScript tek dosya üretilip
oxcile derleniyor. App Store incelemesinden geçmesi zor olduğu için Xcode ile doğrudan derlemek gerekiyorApple’ın App Store’da yerel LLM’leri kısıtlıyor gibi göründüğü söylenmiş. Uygulamayı doğrudan dağıtmaya çalışırken 2.5.2 maddesine takıldığı belirtilmiş
İlgili başlık olarak Gemma 4 on iPhone paylaşılmış
iPhone 16 Plus’ta hızın çok yüksek olduğu, ancak uzun mesajlarda keskin şekilde düştüğü söylenmiş. Bunun termal throttling kaynaklı olmadığı belirtilmiş. Tanılama verilerinin görülmek istendiği eklenmiş
Gemma 4 içeren Edge Gallery iOS uygulaması beklense de, intents erişim kısıtları ve web araması için özel eklenti gereksinimi nedeniyle kullanımın can sıkıcı olduğu söylenmiş. ChatMCP’nin API tabanlı olduğu için nispeten işe yaradığı belirtilmiş
iPhone 16 Pro’ya Google AI Edge Gallery kurulup benchmark çalıştırılmış
GPU üzerinde Prefill 231t/s, Decode 16t/s, ilk token’a kadar 1.16 saniye ve başlatma süresi 20 saniye sonucu paylaşılmış
Küçük modeller kullanılırken dikkatli olunması gerektiği söylenmiş
“Bir köpek avokado yiyebilir mi?” sorusuna modelin kendinden emin şekilde ‘Yes’ dediği aktarılmış. Modelin sınırlarının bilinmesi gerektiği vurgulanmış
Çevrimdışı olsa bile Google’ın girdi verilerini veya cihaz bilgilerini toplayabileceğinden şüphe edilmiş