1 puan yazan GN⁺ 3 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Apple'ın Foundation Models framework'üne Claude'u sunucu tarafı model olarak bağlayan bir Swift paketi; bu sayede geliştiriciler Apple'ın cihaz içi modeliyle tamamen aynı kod yolunu kullanarak Claude'u çağırabiliyor
  • Apple'ın WWDC 2026'da tanıttığı LanguageModel protokolü sayesinde, cihaz içi modelle prototip oluşturup yalnızca karmaşık işleri bulut modeline devreden hibrit yapı tek bir standart API ile mümkün hale geliyor
  • Buradaki kilit nokta sağlayıcı değiştirilebilirliği: oturum mantığına dokunmadan yalnızca Swift Package bağımlılığını değiştirerek Apple·Claude·Gemini arasında geçiş yapılabiliyor
  • Anthropic'in Apache 2.0 ile yayımladığı bu paket, "herhangi bir backend bağlanabilir" fikrinin gerçekte çalışan ilk örneği
  • İstekler uygulamadan doğrudan Claude API'sine gidiyor ve Apple bu akışta yer almıyor; bu nedenle prompt'ları ve yanıtları göremiyor, ücretlendirme de doğrudan Anthropic hesabına yansıtılıyor

Neden önemli

  • Şimdiye kadar iOS uygulamalarına dil modeli eklemek için ayrı bir bulut API'sine kayıt, anahtar yönetimi, token başına ücretlendirme ve tüm prompt'ların cihaz dışına gönderilmesi gerekiyordu; Apple, WWDC 2026'da bu uzun süredir devam eden sıkıntıyı giderdi
  • Foundation Models framework'ü, Apple Intelligence'ın cihaz içi modeli, Private Cloud Compute ve Claude·Gemini gibi üçüncü taraf bulutları tek bir yerel Swift API ile çağıracak şekilde genişletildi
  • Anthropic, bu yeni protokolü uygulayan bir Swift paketi yayımladı. Amaç, Apple'ın cihaz içi modelinden devralınan işleri Claude'a geçirip daha karmaşık iş akışlarını yürütmesini sağlamak

Geliştiriciler için ne değişiyor

  • Kod değiştirmeden sağlayıcı geçişi

    • Uygulamayı Apple'ın cihaz içi modeliyle prototipleyip ardından karmaşık sorguları Google Gemini veya Anthropic Claude'a yönlendirmek ya da bunlar arasında geçiş yapmak, yalnızca Swift Package Manager bağımlılığını güncelleyerek; oturum mantığını veya uygulamanın geri kalan kodunu değiştirmeden yapılabiliyor
    • Cihaz içi model; özetleme ve çıkarım gibi hızlı, yerel işler için kullanılırken, çok adımlı akıl yürütme, kod üretimi, web arama ve kod çalıştırma gerektiğinde iş Claude'a devrediliyor
    • Her iki durumda da aynı LanguageModelSession API'si kullanıldığı için yalnızca model: argümanını değiştirerek geçiş yapılabiliyor
  • Tür tabanlı handoff

    • Paketi projeye ekleyip Anthropic API anahtarıyla giriş yaptıktan sonra, Apple'ın cihaz içi modelinin türlendirilmiş çıktısı Claude isteğine aktarılabiliyor; paket de streaming, araç çağrıları ve yapılandırılmış yanıtları yeniden SwiftUI görünümüne işliyor
    • Kılavuz üretimi sayesinde türlendirilmiş Swift değerleri döndürmek için yalnızca üç satır kod yeterli olacak kadar kullanımı basit

Gizlilik ve maliyet yapısı

  • İstekler uygulamadan doğrudan Claude API'sine gönderildiği için Apple istek yolunda yer almıyor ve prompt'ları ya da yanıtları göremiyor
  • Kullanım, standart API fiyatlandırmasıyla doğrudan Anthropic hesabına faturalandırılıyor
  • Uygulama, her oturumda Claude mu yoksa Apple'ın cihaz içi modelinin mi kullanılacağına kendisi karar veriyor

Daha büyük resim

  • Apple, 2025'te yayımladığı cihaz içi model için yerel Swift API'si olan Foundation Models framework'ünü bu yaz açık kaynağa dönüştürmeyi planlıyor ve yeni LanguageModel protokolüyle ister Apple'ın kendi modeli ister uzak bir sağlayıcı olsun, neredeyse tüm modeller tek bir Swift API'nin arkasında LanguageModelSession'ı çalıştırabiliyor
  • Anthropic'in ClaudeForFoundationModels paketi, bu "herhangi bir backend bağlanabilir" yaklaşımının somut bir örneği olarak adapter pattern'i hayata geçiriyor
  • Apple, Dynamic Profiles sistemiyle uygulamaların oturumun ortasında model, araç ve talimat değiştirebilmesini sağlıyor; bunu da çok ajanlı iş akışlarının temeli olarak konumlandırıyor
  • Ancak bu entegrasyon, iOS·iPadOS·macOS·visionOS·watchOS 27 ve Xcode 27 gerektiren beta aşamasında; resmi sürümden önce API'de değişiklik olabilir

1 yorum

 
GN⁺ 3 시간 전
Hacker News yorumları
  • Apple, kullanıcı deneyimini kontrol ederken LLM’leri metalaştırıyor gibi görünüyor
    Donanım şirketi olmanın gereği olarak, yapay zeka kullanımı için en iyi makineleri satmaya devam etme stratejisi bu ve iyi bir tercih gibi duruyor

    • Benedict Evans sonunda haklı çıkmış olabilir. Sınır modelleri giderek 90’lardaki telekom şirketlerine benziyor
      Altyapıya milyarlarca dolar yatırıyorlar ama değeri daha üst katmandaki başka şirketler alıyor
    • Kullanıcı deneyimini kontrol etme meselesinden biraz ayrı ama, bu yapay zekanın en hoşuma giden sonucu. On yıllardır şirketler kendi servislerini duvarlarla çevreleyip berbat arayüzler dayatıyordu; son 12 ayda ise bir anda her şey için MCP ortaya çıktı ve komut satırı sohbet arayüzüyle kullanılabilir hale geldi
      Uyum sağlamayan şirketler, insanların yaptığı yapay zeka tabanlı DIY web scraper’lar tarafından dövüle dövüle sonunda boyun eğmek zorunda kalacak
    • Burada söylenen yapay zeka kullanımı için en iyi makine ifadesi gerçekten doğru mu emin değilim. Bu modeller hâlâ sunucu tarafında çalışmıyor mu?
    • Yapay zekanın eninde sonunda işletim sistemi seviyesinde gömülü olacağı birkaç yıl öncesinden belliydi. Apple da Apple Intelligence’ı ilk tanıttığında bunun farkındaydı
      LLM’leri metalaştırmak gibi bir ifade yerinde olabilir ama bu zaten birkaç yıldır cilalanan kullanıcıya dönük bir özellik
    • Şimdi bir tek donanımı metalaştırmak kaldı
  • Apple's Foundation Models framework içinde Claude’u sunucu tarafı dil modeli olarak kullanmayı sağlayan bir Swift paketiymiş; ben ters yönde bir şey bekliyordum. Claude Code’un mevcut yeteneklerinin bir şekilde dizüstümdeki Neural Engine üzerinde yerelde çalışmasını ummuştum
    M2 ve 8GB RAM ile bu boş bir hayal ama kısa bir an için umutlanmıştım

    • Şu WWDC oturumuna bakabilirsiniz. Elbette sınır modelleriyle rekabet edemez ve 8GB de fazlasıyla küçük olur ama Apple MLX + OpenCode demosu yaptı
      https://developer.apple.com/videos/play/wwdc2026/232/
      https://www.youtube.com/watch?v=wykPErJ8M-8
    • OpenCode veya Pi, SSD streaming ile kullanılırsa teknik olarak tüm özelliklere sahip olabilir. Sadece katlanılamayacak kadar yavaş olur
    • Çoğu sınır kodlama modeli, tüm yeteneklerini kullanabilmek için 300GB ile 1TB arası bir şeye ihtiyaç duyuyor gibi görünüyordu
    • Claude Code, ortam değişkenleri üzerinden uyumlu bir API olduğu sürece kelimenin tam anlamıyla istediğiniz herhangi bir endpoint’e sorgu gönderebilir
    • Bulut aslında kullanıcının özel iCloud’u olsaydı kulağa makul gelirdi. Kullanıcı ücreti öder, işlem de zaten iPhotos’u depolayan Apple sunucularının yakınında gerçekleşirse oldukça zarif bir çözüm olabilirdi
      Ama gerçekte, nerede barındırıldığı bile belirsiz olan Claude’u alıyorsunuz. X-AI veri merkezi olabilir, Amazon’un bir yerleri olabilir, kimse bilmiyor
  • Bu sadece Claude’a özel değil. Geliştiriciler, Google’ın sunucu tabanlı Gemini modellerini çağıran uygulamalar da yapabiliyor
    WWDC’de Apple, Foundation Models framework’ünü üçüncü taraf bulut model sağlayıcılarına açacağını duyurdu. iOS 27, macOS 27, iPadOS 27, visionOS 27 ve watchOS 27’den itibaren model sağlayıcıları, model çıkarımı için ortak bir arayüz sunmak üzere yeni herkese açık LanguageModel protokolünü uygulayabilecek. Google da Firebase Apple SDK üzerinden Gemini modellerini Foundation Models framework içinde kullanılabilir hale getirdi
    Bu da tam anlamıyla yerel bir geliştirme deneyimi sağlıyor. Bulutta barındırılan Gemini modelleri aynı API üzerinden Foundation Models framework’e doğrudan bağlanabiliyor ve aygıt üstündeki Apple modelleri ile bulutta barındırılan Gemini modelleri ortak bir API yüzeyinin arkasında durduğu için, kullanım senaryosuna göre yerel çıkarım ile bulut çıkarımı arasında kolayca geçiş yapılabiliyor
    https://blog.google/innovation-and-ai/technology/developers-...

    • Asıl önemli olan, Apple’ın OpenAI uyumlu API’yi language model protocol diye yeniden adlandırmış olması; o korkunç derecede uzun ifadeye lanetlenmeden önce herkesin hızla burada birleşmesi gerek
  • Apple’ın böyle bir soyutlama sunması sevindirici, ama asıl endişe yerel model tarafında
    Örneğin Gemma4 kullanmak isteseniz bile, kullanıcı açısından 10 uygulama aynı modeli ayrı ayrı indirirse telefon gereksiz yere şişer
    Apple’ın birden fazla uygulamanın cihaz içindeki aynı modeli kullanabilmesi için bir yöntem sunup sunmadığını henüz anlayamadım. Karmaşık namespace’ler ya da izin hileleri olmadan mümkün olmalı
    Buna işaret eden bir şey görmedim

    • Bence Apple’ın kaçınmaya çalıştığı şey tam olarak bu. Cihaz içi zekaya ihtiyaç varsa, önerileri “zaten cihazda bulunan model en iyisi” yönünde oldu; daha spesifik bir şey gerekiyorsa da adaptörler, yani fine-tuning/LoRA en iyi seçenek olarak görülüyor
      Cihaz içi modeller çok gerideyken bu yanlıştı, ama uzun vadede hâlâ doğru olabilir
      Kullandığım birden fazla uygulama Gemma 4 E4B’ye ihtiyaç duyabilir, ama ben düzinelerce uygulama kullanıyorum ve geliştiriciler yüzlerce model arasından seçim yapabiliyor. Ortak cache çakıştığında biraz alan kazandırır ama temel sorun kalır. Her uygulama model seçerse disk ve bellek swapping’i patlar
      Cihaz üreticisinin varsayılanı gömülü sunması muhtemelen daha iyi. Başka modellerin kullanımını engellemek gerektiğini söylemiyorum, ama tek bir paylaşılan varsayılan, uygulamaların %99’u için hem geliştirici hem kullanıcı deneyimi açısından en iyi seçenek olabilir
      Zaten belleğe yüklenmiş olması en büyük performans artışı ve varsayılan modelin sıcak tutulma ihtimali çok daha yüksek
      “En iyi model” çoğu zaman RAM ve işlem bütçesi hesaba katıldığında “bu cihaz için en iyi model” demek. Geliştirici her cihazı test edemez ama Apple edebilir ve edecektir
      Her modelin donanıma göre optimize edilmesi gerekir. ANE, Metal ve CPU üzerinde neyin nerede çalıştığı önemlidir ve varsayılan model optimize edilmiş olur
      Özelleştirilmiş modele ihtiyaç varsa LoRA muhtemelen en iyi yol. Yaklaşık 30MB ve yukarıdaki avantajların hepsini sunabilir
      Varsayılanın değiştirilebilir olması gerektiği söylenebilir, ama bu Apple’dan çok Linux tarzı bir ideale yakın, bu yüzden pratikte görüp görmeyeceğimiz şüpheli. Üstelik gerçek dezavantajları da var. İstenmiş olsun ya da olmasın, prompt’lar geliştirilen hedef modele göre optimize edilir; bu yüzden varsayılan sistem modelini değiştirirseniz tüm uygulamaların kalitesi düşebilir
    • Apple için geliştiricilerin modelleri kaydetmesini sağlayacak genel amaçlı benzersiz model kimliği protokolü ve paylaşımlı depolama sunmak iyi bir fırsat
    • “Bring an LLM provider to the Foundation Models framework” bölümüne bakın
      https://developer.apple.com/videos/play/wwdc2026/339
    • Uygulamalar aynı framework ve API ile sistemin sağladığı cihaz içi modeli kullanabiliyor. Ama uygulamalar arasında özel modellerin yinelenmesini önleyen bir mekanizma yok
    • Zaten foundation models tam da bu. Android’deki AICore da benzer şekilde içeride Gemma kullanıyor ve uygulamalar kendi modellerini bundle etmek yerine LLM’e sorgu gönderip yanıt alıyor
  • Apple’ın geliştiricileri LLM’leri kendi API soyutlama katmanı üzerinden kullanmaya yönlendirdiğini düşünüyorum. Daha sonra kendi LLM’ini çıkardığında geliştiricilerin sorunsuz geçiş yapmasına yardımcı olmak için de olabilir
    Apple’ın eğitime çok para harcadığını ve bunun Siri ya da mevcut Apple AI ile somehow bağlantılı olabileceğini duymuş gibiyim. Ya da bu sadece geliştirici kolaylığıdır; başka bir niyet olup olmadığını merak ediyorum

    • Apple’ın kullanıcı verilerini korumak için oldukça akıllı düzenekleri var. Kısa süre önce uygulama takibiyle ilgili işler yapmam gerekti ve SKAN ile diferansiyel gizlilik kullanılarak anonimleştirilmiş kohortların içinde kullanıcı ayrıntılarını gizleyip, takip olaylarını üçüncü taraf platformlara bildirmeden önce bunları saklama biçimi beklediğimden daha iyi tasarlanmıştı
      Gizliliğe önem veriyorsanız Apple’ın araya girmesinin bir değeri var
    • Bu, reality/mac/iPad/watch/tv/iOS 27’ye gelen yeni framework desteği. Bunu yıl sonuna doğru açık kaynak yapacaklarını söylediler; dolayısıyla Swift’i backend’de dağıtıyorsanız orada da kullanabilirsiniz gibi görünüyor
      Bu framework’ün asıl olayı, aynı API ile cihazdaki yerleşik modeli, Apple’ın barındırdığı çevrimiçi model Private Cloud Computer’ı ya da rastgele barındırılan çevrimiçi modellere çağrı yapan kendi shim’inizi hedefleyebilmeniz
      Böylece “bunu yerel modelle, şunu Claude ile kullanmak istiyorum” diye kendi soyutlama katmanınızı kurmanıza ya da Anthropic/OpenAI API entegrasyonunu doğrudan eklemenize gerek kalmadan, sistem API’si üzerinden çağrıları farklı model/sağlayıcı türlerine dinamik olarak yönlendirebiliyorsunuz
      Tool calling gibi şeyleri tek yerde soyutlamak ve oturum sırasında sağlayıcıyı ya da modeli dinamik olarak değiştirseniz bile aynı transcript üzerinden devam edebilmek gibi çeşitli kolaylıklar ve ilginç özellikler var
    • Alaycı ya da daha gerçekçi bakarsak, bu soyutlama katmanı Apple’ın, gerçek LLM başka bir şirket tarafından sağlansa bile kullanıcıların bu yeteneği Apple Intelligence’ın başarısı olarak görmesini sağlamaya yönelik yöntemi gibi duruyor
    • Karanlık bir yorum ama tamamen haksız da değil. Apple, başka şirketlerin sağladığı modellere dair ödemeleri almayı kolaylaştırabilir ve isterse kullanıcıların üçüncü taraf modelleri nasıl kullandığına dair verileri toplayıp kendi model eğitimi için veri seti oluşturabilir
      Bu API yalnızca Apple cihazlarında çalıştığı için, iOS’ta düzgün çalışmak isteyen geliştiriciler açısından pazarı bölüp aynı sistemi kullanmayı engelleyen ve kullanıcıyı daha da kilitleyen bir etkisi de olabilir
    • Geliştiricilerin bu framework üzerinden hâlihazırda kullanabildiği bir cihaz içi model zaten var. Claude ise buna eklenen modellerden sadece biri
  • Apple'ın kendi cihaz içi modelinin daha iyi hale gelmesine hazırlandığı anlaşılıyor; Gemini'ye erişim sağlanmış olduğunu düşününce bu mantıklı
    Geliştiriciler tüm harici LLM çağrı kodlarını bununla yazarsa, Apple modeli daha yetkin hale gelip daha fazla kullanım senaryosunu kapsadığında tek tek çağrı noktalarında kolayca değiştirilebilir. Bu da uygulama kullanıcı deneyimini iyileştirir ve Apple'ın komisyon alamadığı geliştirici faturalandırma maliyetlerini azaltır

    • Başka bir deyişle, para kazandırmadığı için bunun olma ihtimali düşük. Apple'ın, insanların abone olabileceği yeni AI ve AI-lite tarifeleri oluşturması daha olası
      Apple bir şirket ve şirketlerin neyi önemsediğini hepimiz bildiğimiz için, telefonda yerel model çalışan bir ütopya olma ihtimali düşük görünüyor
    • Gemini kullanmanın cihaz içi modeli nasıl daha iyi hale getirdiğini anlamıyorum
    • Kullanıcı deneyimi, ekosistem inşa etmenin başka bir adıdır ve Apple bunu rakiplerinden daha iyi yaptığı şeylerin başında geliyor. Buna uygun donanım da üretmesi ayrıca zarar vermez
      Microsoft ve Nvidia boşuna ortak hareket etmiyor
  • Bunu kullanıcıya dağıtılacak yazılımda pratikte nasıl kullanacaklarını merak ediyorum. Kullanıcıya doğrudan API anahtarı oluşturup girdirtmek, iyi bir kullanıcı deneyimi için fazla yüksek bir eşik

    • Daha büyük engel, sıradan kullanıcıya, yani geliştirici olmayan kişiye token tabanlı fiyatlandırmayı kabul ettirmek
      “Bir sorunun ne kadara mal olacağını bilmeden para öde, istediğin yanıtı alamayabilirsin ve daha fazla kullanmak için daha fazla ödersin” yapısı, kumarbaz olmayan çoğu insan için cazip değil. Uzun bir konuşmanın sonundaki “teşekkürler”in bağlam yüzünden pahalı olabileceğini anlatmak, ortalama bir kullanıcı için daha da zor kabul edilir
      Token maliyetlerinin yo-yo gibi inip çıkması da yardımcı olmuyor. Sıradan kullanıcı sabit maliyet ister ve AI akışını sürekli takip etmek için enerji harcamak istemez. “Geçen ay aboneliğim çok daha uzun gidiyordu” gibi sorunlar da iyi bir yön değil
      Çoğu durumda yerel LLM'lerin gelecek olduğu yönündeki Apple değerlendirmesinin doğru olduğunu düşünüyorum
    • Kesinlikle öyle. allihat.com'u işletiyorum; hâlâ Claude ile iletişim kuran tek Safari uzantısı gibi görünüyor ve epey talep de var. Ama kullanıcının kendi lanet Claude API anahtarını girmesi gerekiyor
      Anthropic'in şartlarını da hâlâ tam olarak anlayabilmiş değilim. setup-token Set up a long-lived authentication token (requires Claude subscription) gibi bir şeyi girebiliyorsunuz ama tuzak gibi görünüyor. Bunu kimin kullandığını bilmiyorum ve herhangi bir yerde kullanınca anında şart ihlali sayılmıyor mu diye düşünüyorum
      Şu anda allihat.com'da, Claude anahtarı kullanmak istemeyenler için yerel Apple modelini açtım ve ücretli kullanıcıya dönüşüm oranı yaklaşık 3 kat arttı. Ama elbette Claude'un yerine geçen bir şey değil. Apple'ın, Claude proxy işini kendisinin hallettiği bir mekanizma sunmasını isterdim. Böylece Claude API kullanımını yönetmek için benim de kendi sunucum üzerinden proxy yapmam gerekmezdi
    • Prodüksiyonda isteklerin .proxied ile kendi backend'iniz üzerinden yönlendirilmesi gerektiği yazıyor
      Apple, 2 milyonun altında indirmesi olan geliştiricilere kendi sunucuları üzerinden ücretsiz AI modelleri sunuyor https://techcrunch.com/2026/06/08/apple-bets-cheaper-ai-will...
    • Eskisi gibi, istekleri kendi backend'iniz üzerinden proxy'leyin yeter
    • Kullanıcılar API anahtarı vermiyor. Belgelerde backend proxy kurulumunun nasıl yapılacağı anlatılıyor
  • “İstekler uygulamadan doğrudan Claude API'ye gider, Apple istek yolunda yer almaz ve istemleri ya da yanıtları görmez” ifadesinin geliştirici bakış açısından söylendiğini anlıyorum
    Ama tüketici açısından bakınca sadece komik geliyor

    • Neden?
  • Microsoft önce Copilot kullanım şartlarına “Copilot yalnızca eğlence amaçlı sağlanır” ifadesini koyup, Excel için Copilot'a da “doğruluk veya yeniden üretilebilirlik gerektiren görevlerde, yasal/düzenleyici/uyumluluk etkisi olan işlerde COPILOT kullanımından kaçının” uyarısını ekleyerek düzeni bozdu
    Ardından Apple, rakip bir LLM yapmak için onlarca milyar hatta yüz milyarlarca dolar yatırım yapmayarak sessizce oyuna tam girmeyi reddediyor. Elbette saf kullanıcılar için Claude'u yeniden satıyor ya da Gemini'den yararlanıyor ama Apple durumun farkında
    https://www.microsoft.com/en-us/microsoft-copilot/for-indivi...
    https://support.microsoft.com/en-US/Excel/copilot-function

  • Kodlama ajanlarının kendisi zaten zorla eklenmiş bir katman gibi; şimdi bir katman daha mı ekleniyor diye düşünüyorum. Kodlama ajanları çoğu zaman 90'lardaki personel tedarik şirketlerinin vendor manager'ları gibi davranıyor
    Müşteriye yeryüzündeki her şeyi vaat edip, zavallı sözleşmeli çalışanı sıkıştırarak teslimat yaptırıyorlar. Kodlama ajanları da, tıpkı personel firmalarının müşteriye kestiği ücretle sözleşmeli çalışana ödediği ücret arasındaki fark gibi, 10 kat daha fazla token tüketiyor. Basit bir testte, kodlama ajanı üzerinden geçince modelin bağlam uzunluğunu aştığı aynı iş, doğrudan prompt verildiğinde sorunsuz çalışıyor
    Katmanlar lükstür; kontrolü ve şeffaflığı ortadan kaldırır

    • Kodlama ajanı yaparken bunu kullanmayacağım