- Apple Neural Engine (ANE) üzerinde çalışabilen bir LLM çıkarım pipeline'ı sunuyor
- Hugging Face modellerine dayanarak Swift/C++ tabanlı uygulamalarda veya iOS/macOS uygulamalarında cihaz üzerinde çıkarımı mümkün kılıyor
- En güncel 0.3.0 Alpha sürümü; Hugging Face modellerini CoreML formatına dönüştüren araçlar, Swift tabanlı çıkarım CLI uygulaması, iOS/macOS uygulama örnekleri, Python test kodu ve benchmark araçlarını içeriyor
- LLaMA 3.2 (1B / 8B) modelleri ile Distilled DeepSeek R1 8B ve DeepHermes 3B/8B'yi destekliyor; gelecekte daha çeşitli model mimarilerine genişlemesi planlanıyor
- Amaç, Hugging Face modellerini ANE için dönüştürebilen esnek ve kullanımı kolay bir framework sağlamak
1 yorum
Hacker News görüşleri
Apple'ın ANE için optimize edilmiş modellerde "10 kata kadar daha hızlı ve 14 kat daha düşük bellek tüketimi" iddiası konusunda sonradan bir gelişme olup olmadığı merak ediliyor
Snapdragon X dizüstü bilgisayarlar çıktığında NPU'nun LLM'ler için kullanılacağı iddia edilmişti
Neural Engine'in boşa harcanmış silikon gibi hissettirdiği söyleniyor
Asıl avantajın çok daha düşük güç kullanımı olduğu belirtiliyor
README'de en önemli bilgi yok
Bu teknolojinin asıl sırrının ne olduğu anlaşılmaya çalışılıyor
Apple'ın birleşik belleği, birden fazla GPU gerektiren büyük modelleri çalıştırmaya yetecek kadar RAM sağlıyor
coreml'in ANE'yi kullanıp kullanmadığı merak ediliyor
M serisi MacBook'larda çıkarım hızında bir performans avantajı olup olmadığı merak ediliyor
Apple'ın ANE üzerindeki sıkı kontrolü şaşırtıcı bulunuyor