1 puan yazan fastkoder 3 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş

Başlık:
Mac üzerinde çalışan gerçek zamanlı yapay zeka ses Agent’ı — TalkMode

Alt başlık:
Gaze, gerçek zamanlı STT/TTS ve Claude/OpenAI entegrasyonu tabanlı Agent-OS tarzı ses arayüzü

TalkMode basit bir sesli sohbet botundan ziyade
“gerçek zamanlı, iş odaklı bir yapay zeka ses Agent’ı”na daha yakın bir proje.

Teknik açıdan ilgi çekici noktalar:

  • macOS native tabanlı düşük gecikmeli ses etkileşimi
  • Gerçek zamanlı STT ↔ LLM ↔ TTS pipeline’ı
  • Türkçe dahil çok dilli sesli konuşma optimizasyonu
  • gaze tabanlı etkileşim denemeleri
  • turn-taking (konuşma zamanlaması kontrolü) işleme
  • OpenAI / Claude / CLI Agent entegrasyon yapısı
  • Agent OS tarzı workflow odaklı yaklaşım
  • local-first mimari yaklaşımı

Özellikle basit bir “soru-cevap tipi sesli sohbet” değil de:

  • toplantılar
  • beyin fırtınası
  • geliştirme desteği
  • araştırma
  • IDE/CLI bağlantısı

Gibi “sürekli iş akışlarını” ses üzerinden birbirine bağlamayı hedefleyen bir yönelim görülüyor.

Aşağıdaki gibi bir akışı gerçekten hedefliyormuş hissi veriyor:

Mic Input  
  ↓  
Streaming STT  
  ↓  
Context / Memory  
  ↓  
LLM Agent  
  ↓  
Tool Calls / CLI  
  ↓  
Realtime TTS  

Bir diğer ilginç nokta da şu:
Mevcut Voice Assistant’lar daha çok “mobil asistan” hissi verirken,
TalkMode, Claude Code / Codex / terminal kültürüyle bağlantılı
“geliştiriciler için bir ses Agent’ı”na daha yakın görünüyor.

Resmi site:
https://talkmode.baryon.ai/

GitHub:
https://github.com/baryonlabs

Henüz yorum yok.

Henüz yorum yok.