- Apple, görüntü-dil yapay zeka modellerini (AFM, Apple Foundation Models) ve geliştiricilere yönelik Foundation Models framework’ünü (API) yeni olarak tanıtarak, hem cihaz içi hem de bulut modellerinin performansını ve verimliliğini büyük ölçüde iyileştirdi
- AFM cihaz içi modeli, 3B parametreli bir transformer ve 300 milyon parametreli bir vision transformer’dan oluşuyor; metin ve görsel girdileri ile çok dilli ve görsel yetenekleri destekliyor. Sunucu modeli ise özel bir MoE mimarisi kullanıyor
- Model hafifletme (quantization ve LoRA), 15 dil desteği, görsel anlama, araç kullanımı gibi güçlü özellikler ve geliştirici erişilebilirliği sunuluyor
- Cihaz içi model, ABD dışı İngilizce ve görsel anlama alanlarında rakip modellere karşı güçlü görünürken, sunucu modeli GPT-4o gibi en yeni modellere kıyasla yetersiz kalıyor
- Son dönemde tartışma yaratan Apple makalesi, Siri AI yükseltmesindeki gecikme gibi gelişmelerle birlikte Apple’ın AI stratejisindeki değişim ve iOS ekosistemi içindeki etkisi dikkat çekiyor
Apple Foundation Models (AFM) için büyük güncelleme
- Apple, cihaz içi (mobilde çalışan) ve sunucu tarafından barındırılan AI modellerini (AFM) birlikte yükseltti; hız, verimlilik ve performans önemli ölçüde arttı
- Yeni sunulan geliştirici API’si (Foundation Models framework) sayesinde, Apple Intelligence özelliklerinin etkin olduğu cihazlarda cihaz içi AI çağrıları yapılabiliyor
Temel mimari ve özellikler
- Girdi/çıktı: metin, görsel (en fazla 65.000 token girdi), çıktı ise metin
- Mimari:
- AFM-on-Device: 3 milyar parametreli transformer, 300 milyon parametreli vision transformer
- AFM-Server: özel Mixture-of-Experts (MoE) transformer (parametre sayısı açıklanmadı), 1 milyar parametreli vision transformer
- Performans: ABD dışı İngilizce ve görsel anlamada güçlü
- Kullanılabilirlik: AFM-on-Device, Foundation Models framework üzerinden kullanılabiliyor. AFM-Server ise herkese açık kullanıma sunulmadı
- 15 dil desteği, araç kullanımı gibi yetenekler sunuluyor
- Açıklanmayan bilgiler: sunucu modelinin parametre sayısı, token sınırı, eğitim veri setinin ayrıntıları vb. paylaşılmadı
Teknik farklılıklar ve optimizasyonlar
- Quantization:
- Cihaz içi modelde ağırlıkların büyük bölümü 2 bit’e, embedding katmanı ise 4 bit’e sıkıştırıldı (quantization-aware training kullanıldı)
- Sunucu modelinde ASTC (grafik sıkıştırma tekniği) uygulandı; ortalama 3,56 bit’e (embedding 4 bit) sıkıştırıldı
- LoRA adaptörleri, sıkıştırmanın yol açtığı performans kaybını telafi ediyor ve özetleme, düzeltme, soru-cevap gibi belirli görevlere uyum sağlıyor
- Özel MoE mimarisi, donanımlar arası iletişim ek yükünü en aza indirerek verimliliği artırıyor
Performans değerlendirmesi
- Cihaz içi model: ABD dışı İngilizce ve görsel anlamada Qwen2.5-VL-3B gibi rakip modellere üstünlük sağlıyor
- Sunucu modeli: Qwen3-23B’ye karşı yer yer hafif üstünlük gösterse de, GPT-4o gibi en yeni modellere yetişemiyor
Son tartışmalar ve AI stratejisindeki değişim
- Apple, kısa süre önce en yeni 5 AI modelinin akıl yürütme sınırlarını test eden makalesiyle tartışma yarattı; buna yanıt niteliğinde makaleler de kısa süre sonra yayımlandı
- Siri AI yükseltmesi süresiz olarak ertelendi ve yeni iPhone’larda AI özelliklerinin yetersiz olduğu gerekçesiyle toplu dava da açıldı
- Google/Android tarafının AI yarışında hızla öne geçtiği bir ortamda Apple, Foundation Models gibi adımlarla AI stratejisini yeniden şekillendiriyor
Gelecek görünümü ve etkiler
- iOS’un varsayılan yerleşik model olarak uygulama geliştirici ekosistemi üzerinde büyük etki yaratma olasılığı yüksek
- Bellek kısıtları ve model boyutu sorunları nedeniyle, uygulama geliştiricilerinin AI modellerini doğrudan paketlemek yerine Apple’ın sunduğu modelleri kullanması hızla yaygınlaşabilir
- Apple’ın AI’ı platformlaştırma stratejisinin uygulama inovasyonunu ve cihaz içi AI kullanımının genişlemesini teşvik edip etmeyeceği yakından izleniyor
Henüz yorum yok.