Pi-C.A.R.D
İçindekiler
- Giriş
- Kullanım
- Donanım
- Kurulum
Giriş
- Pi-card, Raspberry Pi üzerinde tamamen çalışan yapay zeka tabanlı bir sesli asistandır.
- Genel konuşma senaryolarında ChatGPT gibi standart LLM'lerin yapabildiği her şeyi yapabilir.
- Kamera takılıysa, Pi-card'dan fotoğraf çekmesini isteyebilir, gördüğünü açıklatabilir ve görüntü hakkında sorular sorabilirsiniz.
Neden Pi-card?
- Raspberry Pi - C amera A udio R ecognition D evice ifadesinin kısaltmasıdır.
- Daha iyi bir kısaltma bulabilirseniz issue veya pull request göndermeniz isteniyor.
Nasıl çalışır?
- Pi-card tamamen Raspberry Pi üzerinde çalışır.
- Ana program çalıştığında sistem wake word dinlemeye başlar.
- Wake word'ü söylediğinizde konuşma başlar ve konuşma sırasında wake word'ü tekrar tekrar söylemeniz gerekmez.
- "Dur", "çıkış", "güle güle" gibi ifadeler söyleyene kadar komutları dinlemeye devam eder.
- Konuşma sırasında sistem belleği korur; böylece önceki konuları tekrar edebilir veya daha ayrıntılı açıklayabilir.
- Sistem tamamen yerelde çalışacak şekilde tasarlanmıştır, ancak konuşmayı geliştirmek veya harici cihazları kontrol etmek için dış API'ler ya da servisler bağlanabilir.
- Örneğin "fotoğraf çek" veya "ne görüyorsun" derseniz kamera etkinleşir.
Ne kadar kullanışlı?
- Bu sistem eğlenceli bir proje olarak tasarlanmıştır ve bir ölçüde kullanışlı bir yapay zeka asistanıdır.
- Her şey yerelde gerçekleştiği için bulut tabanlı sistemler kadar hızlı veya güçlü değildir.
- Ancak yine de geliştirilebilecek çok şey vardır.
Neden uygulama değil?
- Amaç, tamamen çevrimdışı çalışan ve internet bağlantısı gerektirmeyen bir sesli asistan oluşturmaktı.
- Bu, kullanıcının gizliliğini korumak ve verilerin üçüncü taraf sunuculara gönderilmesini önlemek içindir.
Kullanım
- Depoyu indirip gereksinimleri kurduktan ve diğer kurulum adımlarını tamamladıktan sonra ana programı şu komutla çalıştırabilirsiniz:
python assistant.py
- Program çalıştığında wake word'ü söyleyerek asistanla konuşmaya başlayabilirsiniz.
- Varsayılan wake word "hey assistant" olsa da bunu
config.py dosyasında değiştirebilirsiniz.
Donanım
- Raspberry Pi 5 Model B
- USB mikrofon
- Hoparlör
- Kamera
Kurulum
Yazılım
- Sistemi mümkün olduğunca hızlı ve hafif tutmak için ses transkripsiyonu ve görsel dil modeli için cpp uygulamaları kullanılıyor.
- Ses transkripsiyonu
whisper.cpp kütüphanesini, görsel dil modeli ise llama.cpp kütüphanesini kullanır.
- Her depoyu istediğiniz konuma clone edip yollarını
config.py dosyasına eklemeniz gerekir.
- Clone işleminden sonra her depoya gidip modeli çalıştırmak için kurulum talimatlarını izleyin.
Donanım
- Donanım kurulumu oldukça basittir.
- Raspberry Pi 5 Model B, USB mikrofon, hoparlör ve kameraya ihtiyacınız vardır.
- USB mikrofon ve hoparlör, Raspberry Pi'nin USB portlarına bağlanabilir.
- Kamera, Raspberry Pi'nin kamera portuna bağlanabilir.
- Kullanılan donanım:
- Raspberry Pi 5 kiti
- USB mikrofon
- Hoparlör
- Kamera
- Kamera konnektörü
- Pi 5'te yeni bir kamera portu bulunduğu için yeni bir kamera konnektörü gerekir.
GN⁺ Görüşü
- Pi-card, Raspberry Pi'yi kullanan ilgi çekici bir proje ve yapay zeka ile donanımın birleşimi sayesinde çeşitli olasılıkları keşfetmeyi mümkün kılıyor.
- Tamamen çevrimdışı çalıştığı için gizlilik koruması açısından büyük bir avantaja sahiptir.
- Bulut tabanlı sistemlere kıyasla performansı daha düşük olabilir, ancak yerelde çalıştığı için veri güvenliği artar.
- Benzer işlevler sunan diğer projeler arasında Mycroft AI ve Jasper bulunur.
- Bu teknolojiyi kullanmaya başlarken donanım ve yazılım kurulumu bir miktar karmaşık olabileceğinden yeterli ön hazırlık gerekir.
Henüz yorum yok.