Apple Foundation Models'e Claude eklemek
(platform.claude.com)- Apple'ın Foundation Models framework'üne Claude'u sunucu tarafı model olarak bağlayan bir Swift paketi; bu sayede geliştiriciler Apple'ın cihaz içi modeliyle tamamen aynı kod yolunu kullanarak Claude'u çağırabiliyor
- Apple'ın WWDC 2026'da tanıttığı
LanguageModelprotokolü sayesinde, cihaz içi modelle prototip oluşturup yalnızca karmaşık işleri bulut modeline devreden hibrit yapı tek bir standart API ile mümkün hale geliyor - Buradaki kilit nokta sağlayıcı değiştirilebilirliği: oturum mantığına dokunmadan yalnızca Swift Package bağımlılığını değiştirerek Apple·Claude·Gemini arasında geçiş yapılabiliyor
- Anthropic'in Apache 2.0 ile yayımladığı bu paket, "herhangi bir backend bağlanabilir" fikrinin gerçekte çalışan ilk örneği
- İstekler uygulamadan doğrudan Claude API'sine gidiyor ve Apple bu akışta yer almıyor; bu nedenle prompt'ları ve yanıtları göremiyor, ücretlendirme de doğrudan Anthropic hesabına yansıtılıyor
Neden önemli
- Şimdiye kadar iOS uygulamalarına dil modeli eklemek için ayrı bir bulut API'sine kayıt, anahtar yönetimi, token başına ücretlendirme ve tüm prompt'ların cihaz dışına gönderilmesi gerekiyordu; Apple, WWDC 2026'da bu uzun süredir devam eden sıkıntıyı giderdi
- Foundation Models framework'ü, Apple Intelligence'ın cihaz içi modeli, Private Cloud Compute ve Claude·Gemini gibi üçüncü taraf bulutları tek bir yerel Swift API ile çağıracak şekilde genişletildi
- Anthropic, bu yeni protokolü uygulayan bir Swift paketi yayımladı. Amaç, Apple'ın cihaz içi modelinden devralınan işleri Claude'a geçirip daha karmaşık iş akışlarını yürütmesini sağlamak
Geliştiriciler için ne değişiyor
-
Kod değiştirmeden sağlayıcı geçişi
- Uygulamayı Apple'ın cihaz içi modeliyle prototipleyip ardından karmaşık sorguları Google Gemini veya Anthropic Claude'a yönlendirmek ya da bunlar arasında geçiş yapmak, yalnızca Swift Package Manager bağımlılığını güncelleyerek; oturum mantığını veya uygulamanın geri kalan kodunu değiştirmeden yapılabiliyor
- Cihaz içi model; özetleme ve çıkarım gibi hızlı, yerel işler için kullanılırken, çok adımlı akıl yürütme, kod üretimi, web arama ve kod çalıştırma gerektiğinde iş Claude'a devrediliyor
- Her iki durumda da aynı
LanguageModelSessionAPI'si kullanıldığı için yalnızcamodel:argümanını değiştirerek geçiş yapılabiliyor
-
Tür tabanlı handoff
- Paketi projeye ekleyip Anthropic API anahtarıyla giriş yaptıktan sonra, Apple'ın cihaz içi modelinin türlendirilmiş çıktısı Claude isteğine aktarılabiliyor; paket de streaming, araç çağrıları ve yapılandırılmış yanıtları yeniden SwiftUI görünümüne işliyor
- Kılavuz üretimi sayesinde türlendirilmiş Swift değerleri döndürmek için yalnızca üç satır kod yeterli olacak kadar kullanımı basit
Gizlilik ve maliyet yapısı
- İstekler uygulamadan doğrudan Claude API'sine gönderildiği için Apple istek yolunda yer almıyor ve prompt'ları ya da yanıtları göremiyor
- Kullanım, standart API fiyatlandırmasıyla doğrudan Anthropic hesabına faturalandırılıyor
- Uygulama, her oturumda Claude mu yoksa Apple'ın cihaz içi modelinin mi kullanılacağına kendisi karar veriyor
Daha büyük resim
- Apple, 2025'te yayımladığı cihaz içi model için yerel Swift API'si olan Foundation Models framework'ünü bu yaz açık kaynağa dönüştürmeyi planlıyor ve yeni LanguageModel protokolüyle ister Apple'ın kendi modeli ister uzak bir sağlayıcı olsun, neredeyse tüm modeller tek bir Swift API'nin arkasında LanguageModelSession'ı çalıştırabiliyor
- Anthropic'in ClaudeForFoundationModels paketi, bu "herhangi bir backend bağlanabilir" yaklaşımının somut bir örneği olarak adapter pattern'i hayata geçiriyor
- Apple, Dynamic Profiles sistemiyle uygulamaların oturumun ortasında model, araç ve talimat değiştirebilmesini sağlıyor; bunu da çok ajanlı iş akışlarının temeli olarak konumlandırıyor
- Ancak bu entegrasyon, iOS·iPadOS·macOS·visionOS·watchOS 27 ve Xcode 27 gerektiren beta aşamasında; resmi sürümden önce API'de değişiklik olabilir
1 yorum
Hacker News yorumları
Apple, kullanıcı deneyimini kontrol ederken LLM’leri metalaştırıyor gibi görünüyor
Donanım şirketi olmanın gereği olarak, yapay zeka kullanımı için en iyi makineleri satmaya devam etme stratejisi bu ve iyi bir tercih gibi duruyor
Altyapıya milyarlarca dolar yatırıyorlar ama değeri daha üst katmandaki başka şirketler alıyor
Uyum sağlamayan şirketler, insanların yaptığı yapay zeka tabanlı DIY web scraper’lar tarafından dövüle dövüle sonunda boyun eğmek zorunda kalacak
LLM’leri metalaştırmak gibi bir ifade yerinde olabilir ama bu zaten birkaç yıldır cilalanan kullanıcıya dönük bir özellik
Apple's Foundation Models frameworkiçinde Claude’u sunucu tarafı dil modeli olarak kullanmayı sağlayan bir Swift paketiymiş; ben ters yönde bir şey bekliyordum. Claude Code’un mevcut yeteneklerinin bir şekilde dizüstümdeki Neural Engine üzerinde yerelde çalışmasını ummuştumM2 ve 8GB RAM ile bu boş bir hayal ama kısa bir an için umutlanmıştım
https://developer.apple.com/videos/play/wwdc2026/232/
https://www.youtube.com/watch?v=wykPErJ8M-8
Ama gerçekte, nerede barındırıldığı bile belirsiz olan Claude’u alıyorsunuz. X-AI veri merkezi olabilir, Amazon’un bir yerleri olabilir, kimse bilmiyor
Bu sadece Claude’a özel değil. Geliştiriciler, Google’ın sunucu tabanlı Gemini modellerini çağıran uygulamalar da yapabiliyor
WWDC’de Apple, Foundation Models framework’ünü üçüncü taraf bulut model sağlayıcılarına açacağını duyurdu. iOS 27, macOS 27, iPadOS 27, visionOS 27 ve watchOS 27’den itibaren model sağlayıcıları, model çıkarımı için ortak bir arayüz sunmak üzere yeni herkese açık
LanguageModelprotokolünü uygulayabilecek. Google da Firebase Apple SDK üzerinden Gemini modellerini Foundation Models framework içinde kullanılabilir hale getirdiBu da tam anlamıyla yerel bir geliştirme deneyimi sağlıyor. Bulutta barındırılan Gemini modelleri aynı API üzerinden Foundation Models framework’e doğrudan bağlanabiliyor ve aygıt üstündeki Apple modelleri ile bulutta barındırılan Gemini modelleri ortak bir API yüzeyinin arkasında durduğu için, kullanım senaryosuna göre yerel çıkarım ile bulut çıkarımı arasında kolayca geçiş yapılabiliyor
https://blog.google/innovation-and-ai/technology/developers-...
language model protocoldiye yeniden adlandırmış olması; o korkunç derecede uzun ifadeye lanetlenmeden önce herkesin hızla burada birleşmesi gerekApple’ın böyle bir soyutlama sunması sevindirici, ama asıl endişe yerel model tarafında
Örneğin Gemma4 kullanmak isteseniz bile, kullanıcı açısından 10 uygulama aynı modeli ayrı ayrı indirirse telefon gereksiz yere şişer
Apple’ın birden fazla uygulamanın cihaz içindeki aynı modeli kullanabilmesi için bir yöntem sunup sunmadığını henüz anlayamadım. Karmaşık namespace’ler ya da izin hileleri olmadan mümkün olmalı
Buna işaret eden bir şey görmedim
Cihaz içi modeller çok gerideyken bu yanlıştı, ama uzun vadede hâlâ doğru olabilir
Kullandığım birden fazla uygulama Gemma 4 E4B’ye ihtiyaç duyabilir, ama ben düzinelerce uygulama kullanıyorum ve geliştiriciler yüzlerce model arasından seçim yapabiliyor. Ortak cache çakıştığında biraz alan kazandırır ama temel sorun kalır. Her uygulama model seçerse disk ve bellek swapping’i patlar
Cihaz üreticisinin varsayılanı gömülü sunması muhtemelen daha iyi. Başka modellerin kullanımını engellemek gerektiğini söylemiyorum, ama tek bir paylaşılan varsayılan, uygulamaların %99’u için hem geliştirici hem kullanıcı deneyimi açısından en iyi seçenek olabilir
Zaten belleğe yüklenmiş olması en büyük performans artışı ve varsayılan modelin sıcak tutulma ihtimali çok daha yüksek
“En iyi model” çoğu zaman RAM ve işlem bütçesi hesaba katıldığında “bu cihaz için en iyi model” demek. Geliştirici her cihazı test edemez ama Apple edebilir ve edecektir
Her modelin donanıma göre optimize edilmesi gerekir. ANE, Metal ve CPU üzerinde neyin nerede çalıştığı önemlidir ve varsayılan model optimize edilmiş olur
Özelleştirilmiş modele ihtiyaç varsa LoRA muhtemelen en iyi yol. Yaklaşık 30MB ve yukarıdaki avantajların hepsini sunabilir
Varsayılanın değiştirilebilir olması gerektiği söylenebilir, ama bu Apple’dan çok Linux tarzı bir ideale yakın, bu yüzden pratikte görüp görmeyeceğimiz şüpheli. Üstelik gerçek dezavantajları da var. İstenmiş olsun ya da olmasın, prompt’lar geliştirilen hedef modele göre optimize edilir; bu yüzden varsayılan sistem modelini değiştirirseniz tüm uygulamaların kalitesi düşebilir
https://developer.apple.com/videos/play/wwdc2026/339
Apple’ın geliştiricileri LLM’leri kendi API soyutlama katmanı üzerinden kullanmaya yönlendirdiğini düşünüyorum. Daha sonra kendi LLM’ini çıkardığında geliştiricilerin sorunsuz geçiş yapmasına yardımcı olmak için de olabilir
Apple’ın eğitime çok para harcadığını ve bunun Siri ya da mevcut Apple AI ile somehow bağlantılı olabileceğini duymuş gibiyim. Ya da bu sadece geliştirici kolaylığıdır; başka bir niyet olup olmadığını merak ediyorum
Gizliliğe önem veriyorsanız Apple’ın araya girmesinin bir değeri var
Bu framework’ün asıl olayı, aynı API ile cihazdaki yerleşik modeli, Apple’ın barındırdığı çevrimiçi model Private Cloud Computer’ı ya da rastgele barındırılan çevrimiçi modellere çağrı yapan kendi shim’inizi hedefleyebilmeniz
Böylece “bunu yerel modelle, şunu Claude ile kullanmak istiyorum” diye kendi soyutlama katmanınızı kurmanıza ya da Anthropic/OpenAI API entegrasyonunu doğrudan eklemenize gerek kalmadan, sistem API’si üzerinden çağrıları farklı model/sağlayıcı türlerine dinamik olarak yönlendirebiliyorsunuz
Tool calling gibi şeyleri tek yerde soyutlamak ve oturum sırasında sağlayıcıyı ya da modeli dinamik olarak değiştirseniz bile aynı
transcriptüzerinden devam edebilmek gibi çeşitli kolaylıklar ve ilginç özellikler varBu API yalnızca Apple cihazlarında çalıştığı için, iOS’ta düzgün çalışmak isteyen geliştiriciler açısından pazarı bölüp aynı sistemi kullanmayı engelleyen ve kullanıcıyı daha da kilitleyen bir etkisi de olabilir
Apple'ın kendi cihaz içi modelinin daha iyi hale gelmesine hazırlandığı anlaşılıyor; Gemini'ye erişim sağlanmış olduğunu düşününce bu mantıklı
Geliştiriciler tüm harici LLM çağrı kodlarını bununla yazarsa, Apple modeli daha yetkin hale gelip daha fazla kullanım senaryosunu kapsadığında tek tek çağrı noktalarında kolayca değiştirilebilir. Bu da uygulama kullanıcı deneyimini iyileştirir ve Apple'ın komisyon alamadığı geliştirici faturalandırma maliyetlerini azaltır
Apple bir şirket ve şirketlerin neyi önemsediğini hepimiz bildiğimiz için, telefonda yerel model çalışan bir ütopya olma ihtimali düşük görünüyor
Microsoft ve Nvidia boşuna ortak hareket etmiyor
Bunu kullanıcıya dağıtılacak yazılımda pratikte nasıl kullanacaklarını merak ediyorum. Kullanıcıya doğrudan API anahtarı oluşturup girdirtmek, iyi bir kullanıcı deneyimi için fazla yüksek bir eşik
“Bir sorunun ne kadara mal olacağını bilmeden para öde, istediğin yanıtı alamayabilirsin ve daha fazla kullanmak için daha fazla ödersin” yapısı, kumarbaz olmayan çoğu insan için cazip değil. Uzun bir konuşmanın sonundaki “teşekkürler”in bağlam yüzünden pahalı olabileceğini anlatmak, ortalama bir kullanıcı için daha da zor kabul edilir
Token maliyetlerinin yo-yo gibi inip çıkması da yardımcı olmuyor. Sıradan kullanıcı sabit maliyet ister ve AI akışını sürekli takip etmek için enerji harcamak istemez. “Geçen ay aboneliğim çok daha uzun gidiyordu” gibi sorunlar da iyi bir yön değil
Çoğu durumda yerel LLM'lerin gelecek olduğu yönündeki Apple değerlendirmesinin doğru olduğunu düşünüyorum
Anthropic'in şartlarını da hâlâ tam olarak anlayabilmiş değilim.
setup-token Set up a long-lived authentication token (requires Claude subscription)gibi bir şeyi girebiliyorsunuz ama tuzak gibi görünüyor. Bunu kimin kullandığını bilmiyorum ve herhangi bir yerde kullanınca anında şart ihlali sayılmıyor mu diye düşünüyorumŞu anda allihat.com'da, Claude anahtarı kullanmak istemeyenler için yerel Apple modelini açtım ve ücretli kullanıcıya dönüşüm oranı yaklaşık 3 kat arttı. Ama elbette Claude'un yerine geçen bir şey değil. Apple'ın, Claude proxy işini kendisinin hallettiği bir mekanizma sunmasını isterdim. Böylece Claude API kullanımını yönetmek için benim de kendi sunucum üzerinden proxy yapmam gerekmezdi
.proxiedile kendi backend'iniz üzerinden yönlendirilmesi gerektiği yazıyorApple, 2 milyonun altında indirmesi olan geliştiricilere kendi sunucuları üzerinden ücretsiz AI modelleri sunuyor https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will...
“İstekler uygulamadan doğrudan Claude API'ye gider, Apple istek yolunda yer almaz ve istemleri ya da yanıtları görmez” ifadesinin geliştirici bakış açısından söylendiğini anlıyorum
Ama tüketici açısından bakınca sadece komik geliyor
Microsoft önce Copilot kullanım şartlarına “Copilot yalnızca eğlence amaçlı sağlanır” ifadesini koyup, Excel için Copilot'a da “doğruluk veya yeniden üretilebilirlik gerektiren görevlerde, yasal/düzenleyici/uyumluluk etkisi olan işlerde COPILOT kullanımından kaçının” uyarısını ekleyerek düzeni bozdu
Ardından Apple, rakip bir LLM yapmak için onlarca milyar hatta yüz milyarlarca dolar yatırım yapmayarak sessizce oyuna tam girmeyi reddediyor. Elbette saf kullanıcılar için Claude'u yeniden satıyor ya da Gemini'den yararlanıyor ama Apple durumun farkında
https://www.microsoft.com/en-us/microsoft-copilot/for-indivi...
https://support.microsoft.com/en-US/Excel/copilot-function
Kodlama ajanlarının kendisi zaten zorla eklenmiş bir katman gibi; şimdi bir katman daha mı ekleniyor diye düşünüyorum. Kodlama ajanları çoğu zaman 90'lardaki personel tedarik şirketlerinin vendor manager'ları gibi davranıyor
Müşteriye yeryüzündeki her şeyi vaat edip, zavallı sözleşmeli çalışanı sıkıştırarak teslimat yaptırıyorlar. Kodlama ajanları da, tıpkı personel firmalarının müşteriye kestiği ücretle sözleşmeli çalışana ödediği ücret arasındaki fark gibi, 10 kat daha fazla token tüketiyor. Basit bir testte, kodlama ajanı üzerinden geçince modelin bağlam uzunluğunu aştığı aynı iş, doğrudan prompt verildiğinde sorunsuz çalışıyor
Katmanlar lükstür; kontrolü ve şeffaflığı ortadan kaldırır