- Bu yazı, kullanıcıların büyük dil modellerini (LLM'ler) evde BitTorrent'e benzer bir şekilde çalıştırmasını sağlayan yeni bir teknoloji olan Petals'ı tanıtıyor.
- Petals, Llama 2 (70B), Falcon (180B), BLOOM (176B) ve bunların çeşitli türevlerini destekliyor.
- Bu teknoloji, modelin bir bölümünü kullanıcının cihazına yükledikten sonra geri kalan bölümü sağlayan diğer kullanıcıların ağına bağlanarak çalışıyor.
- Llama 2 için 6 token/sn, Falcon için 4 token/sn tekil batch çıkarım hızı sunuyor. Bu hız, sohbet botları ve etkileşimli uygulamalar için yeterli.
- Petals, kullanıcıların istedikleri ince ayar ve örnekleme yöntemlerini kullanmasına, model üzerinde özel yollar çalıştırmasına veya gizli durumları görüntülemesine olanak tanıyarak klasik LLM API'lerinin ötesine geçiyor.
- Petals, PyTorch ve 🤗 Transformers'ın esnekliğini API'lerin kullanım kolaylığıyla birleştiriyor.
- Kullanıcılar Petals'ı Google Colab üzerinde deneyebilir ve belgelerine GitHub üzerinden bakabilir.
- Yazı, projeye başlıca katkı sağlayan kişileri listeliyor ve GPU katkısı yapılabilecek bağlantılar sunuyor.
- Kullanıcılar, Petals'ın gelişimini Discord veya e-posta aboneliği üzerinden takip edebilir.
- Bu proje, BigScience araştırma atölyesinin bir parçası.
1 yorum
Hacker News görüşleri