macOSPilot - macOS için sesli+görsel CoPilot
(github.com/elfvingralf)- macOS'teki tüm uygulamalarda kullanılabilen, ses ve görsel kullanan bir yapay zeka asistanı
- Kısayol tuşuna basıp sesli olarak soru sorduğunuzda, mevcut bağlama göre sesli yanıt verir
- Mevcut pencerenin ekran görüntüsünü alıp OpenAI GPT Vision'a gönderir
- Soruyu OpenAI Whisper API kullanarak yazıya döker ve metinle birlikte gönderir
- Alınan metin yanıtını OpenAI TTS kullanarak sese dönüştürüp çıktı verir
- NodeJS/Electron ile geliştirildi
- Varsayılan kısayol Cmd + Shift + '
1 yorum
Hacker News görüşleri
Prompt içinde
"OSX"yerine"macOS"terimini kullanmanın daha iyi olup olmadığı ya da bunun başta seçilen bir tercih olarak çok da düşünülüp düşünülmediği soruluyor.Yanıt olarak, TTS yerine akış halinde metin seçeneği eklenmesi öneriliyor.
Linux kurulumu için benzer bir betik yazdığını söyleyen bir yorum var.
OpenAI API kullanırken harcama limiti belirlenmesi tavsiye ediliyor.
Projeye yönelik olumlu tepkiler var.
Projenin "open"AI yerine yerel LLM'lerle çalışacak şekilde yapılmasının planlanıp planlanmadığı soruluyor.
Bunu terminalin içine entegre ederek bir şey inşa etmek istediğini söyleyen bir görüş var.
macOSpilot'un NodeJS/Electron kullanmasına olumsuz tepki gösteriliyor.Dijital ses iş istasyonu Ableton Live ile birlikte kullanma deneyimi paylaşılıyor.
lskomutunun sonucunu beklerken üretkenlikle ilgili bir hayal paylaşılıyor.