Apple, cihaz içi ve bulut AI modellerini büyük ölçüde güncelledi ve yeni geliştirici API’lerini tanıttı

(deeplearning.ai)

4 puan yazan GN⁺ 2025-06-26 | Henüz yorum yok. | WhatsApp'ta paylaş

Apple, görüntü-dil yapay zeka modellerini (AFM, Apple Foundation Models) ve geliştiricilere yönelik Foundation Models framework’ünü (API) yeni olarak tanıtarak, hem cihaz içi hem de bulut modellerinin performansını ve verimliliğini büyük ölçüde iyileştirdi
AFM cihaz içi modeli, 3B parametreli bir transformer ve 300 milyon parametreli bir vision transformer’dan oluşuyor; metin ve görsel girdileri ile çok dilli ve görsel yetenekleri destekliyor. Sunucu modeli ise özel bir MoE mimarisi kullanıyor
Model hafifletme (quantization ve LoRA), 15 dil desteği, görsel anlama, araç kullanımı gibi güçlü özellikler ve geliştirici erişilebilirliği sunuluyor
Cihaz içi model, ABD dışı İngilizce ve görsel anlama alanlarında rakip modellere karşı güçlü görünürken, sunucu modeli GPT-4o gibi en yeni modellere kıyasla yetersiz kalıyor
Son dönemde tartışma yaratan Apple makalesi, Siri AI yükseltmesindeki gecikme gibi gelişmelerle birlikte Apple’ın AI stratejisindeki değişim ve iOS ekosistemi içindeki etkisi dikkat çekiyor

Apple Foundation Models (AFM) için büyük güncelleme

Apple, cihaz içi (mobilde çalışan) ve sunucu tarafından barındırılan AI modellerini (AFM) birlikte yükseltti; hız, verimlilik ve performans önemli ölçüde arttı
Yeni sunulan geliştirici API’si (Foundation Models framework) sayesinde, Apple Intelligence özelliklerinin etkin olduğu cihazlarda cihaz içi AI çağrıları yapılabiliyor

Girdi/çıktı: metin, görsel (en fazla 65.000 token girdi), çıktı ise metin
Mimari:
- AFM-on-Device: 3 milyar parametreli transformer, 300 milyon parametreli vision transformer
- AFM-Server: özel Mixture-of-Experts (MoE) transformer (parametre sayısı açıklanmadı), 1 milyar parametreli vision transformer
Performans: ABD dışı İngilizce ve görsel anlamada güçlü
Kullanılabilirlik: AFM-on-Device, Foundation Models framework üzerinden kullanılabiliyor. AFM-Server ise herkese açık kullanıma sunulmadı
15 dil desteği, araç kullanımı gibi yetenekler sunuluyor
Açıklanmayan bilgiler: sunucu modelinin parametre sayısı, token sınırı, eğitim veri setinin ayrıntıları vb. paylaşılmadı

Quantization:
- Cihaz içi modelde ağırlıkların büyük bölümü 2 bit’e, embedding katmanı ise 4 bit’e sıkıştırıldı (quantization-aware training kullanıldı)
- Sunucu modelinde ASTC (grafik sıkıştırma tekniği) uygulandı; ortalama 3,56 bit’e (embedding 4 bit) sıkıştırıldı
LoRA adaptörleri, sıkıştırmanın yol açtığı performans kaybını telafi ediyor ve özetleme, düzeltme, soru-cevap gibi belirli görevlere uyum sağlıyor
Özel MoE mimarisi, donanımlar arası iletişim ek yükünü en aza indirerek verimliliği artırıyor

Cihaz içi model: ABD dışı İngilizce ve görsel anlamada Qwen2.5-VL-3B gibi rakip modellere üstünlük sağlıyor
Sunucu modeli: Qwen3-23B’ye karşı yer yer hafif üstünlük gösterse de, GPT-4o gibi en yeni modellere yetişemiyor

Apple, kısa süre önce en yeni 5 AI modelinin akıl yürütme sınırlarını test eden makalesiyle tartışma yarattı; buna yanıt niteliğinde makaleler de kısa süre sonra yayımlandı
Siri AI yükseltmesi süresiz olarak ertelendi ve yeni iPhone’larda AI özelliklerinin yetersiz olduğu gerekçesiyle toplu dava da açıldı
Google/Android tarafının AI yarışında hızla öne geçtiği bir ortamda Apple, Foundation Models gibi adımlarla AI stratejisini yeniden şekillendiriyor

iOS’un varsayılan yerleşik model olarak uygulama geliştirici ekosistemi üzerinde büyük etki yaratma olasılığı yüksek
Bellek kısıtları ve model boyutu sorunları nedeniyle, uygulama geliştiricilerinin AI modellerini doğrudan paketlemek yerine Apple’ın sunduğu modelleri kullanması hızla yaygınlaşabilir
Apple’ın AI’ı platformlaştırma stratejisinin uygulama inovasyonunu ve cihaz içi AI kullanımının genişlemesini teşvik edip etmeyeceği yakından izleniyor