macOS özelliklerinden %100 yararlanan gerçek zamanlı çok dilli yapay zeka Voice Agent — TalkMode
(talkmode.baryon.ai)Başlık:
Mac üzerinde çalışan gerçek zamanlı yapay zeka ses Agent’ı — TalkMode
Alt başlık:
Gaze, gerçek zamanlı STT/TTS ve Claude/OpenAI entegrasyonu tabanlı Agent-OS tarzı ses arayüzü
TalkMode basit bir sesli sohbet botundan ziyade
“gerçek zamanlı, iş odaklı bir yapay zeka ses Agent’ı”na daha yakın bir proje.
Teknik açıdan ilgi çekici noktalar:
- macOS native tabanlı düşük gecikmeli ses etkileşimi
- Gerçek zamanlı STT ↔ LLM ↔ TTS pipeline’ı
- Türkçe dahil çok dilli sesli konuşma optimizasyonu
- gaze tabanlı etkileşim denemeleri
- turn-taking (konuşma zamanlaması kontrolü) işleme
- OpenAI / Claude / CLI Agent entegrasyon yapısı
- Agent OS tarzı workflow odaklı yaklaşım
- local-first mimari yaklaşımı
Özellikle basit bir “soru-cevap tipi sesli sohbet” değil de:
- toplantılar
- beyin fırtınası
- geliştirme desteği
- araştırma
- IDE/CLI bağlantısı
Gibi “sürekli iş akışlarını” ses üzerinden birbirine bağlamayı hedefleyen bir yönelim görülüyor.
Aşağıdaki gibi bir akışı gerçekten hedefliyormuş hissi veriyor:
Mic Input
↓
Streaming STT
↓
Context / Memory
↓
LLM Agent
↓
Tool Calls / CLI
↓
Realtime TTS
Bir diğer ilginç nokta da şu:
Mevcut Voice Assistant’lar daha çok “mobil asistan” hissi verirken,
TalkMode, Claude Code / Codex / terminal kültürüyle bağlantılı
“geliştiriciler için bir ses Agent’ı”na daha yakın görünüyor.
Resmi site:
https://talkmode.baryon.ai/
GitHub:
https://github.com/baryonlabs
Henüz yorum yok.