21 puan yazan GN⁺ 2025-08-19 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Whispering, bir kısayol tuşuna bastıktan sonra ses → metin dönüşümü yapıp sonucu doğrudan panoya yapıştıran önce yerel çalışan bir ses transkripsiyon aracıdır
  • Mevcut birçok aracın kapalı ve ücretli hizmetler olmasının aksine, Whispering şeffaf veri işleme ve açık kaynak erişilebilirliği sunar
  • Kullanıcılar yerel (Whisper C++, Speaches vb.) veya bulut (Groq, OpenAI, ElevenLabs vb.) seçenekleri arasından seçim yapabilir ve istedikleri yapay zeka dönüşüm özelliklerini ayarlayabilir
  • Uygulama 22MB ile hafif ve hızlı başlatma sunar; özel kısayollar, ses etkinleştirme modu, metni otomatik biçimlendirme gibi gelişmiş özellikler içerir
  • Veri sahipliği ile maliyet tasarrufunu aynı anda sağlayarak, kapalı transkripsiyon SaaS çözümlerine anlamlı bir alternatif oluşturur

Whispering'e genel bakış

  • Whispering, ücretsiz ve açık kaynaklı bir ses transkripsiyon uygulamasıdır; kısayol tuşuna basıp konuştuğunuzda sesi metne çevirir ve otomatik olarak kopyalar
    • Kişisel veriler varsayılan olarak yerelde saklanır ve dışarı gönderilmez
    • İstenirse OpenAI, Groq, ElevenLabs gibi harici API'ler doğrudan bağlanabilir
  • Temel değerleri olarak şeffaflık ve veri sahipliğini garanti etmeyi öne çıkarır

Başlıca özellikler ve öne çıkanlar

  • Ses etkinleştirme modu (Voice Activity Detection, VAD) desteği
    • Kullanıcı konuşmaya başladığında kayıt otomatik başlar, durduğunda otomatik biter
  • Yapay zeka tabanlı dönüşümler (Transformations) özelliği
    • Dilbilgisi düzeltme, çeviri, özetleme, biçim uygulama gibi çeşitli yapay zeka iş akışları yapılandırılabilir
    • OpenAI, Anthropic, Google Gemini, Groq gibi çeşitli LLM sağlayıcıları seçilebilir
  • Özel kısayol desteğiyle kullanıcı ortamına göre özelleştirme yapılabilir
  • Düşük maliyetli yapı: Sağlayıcıya ödeme, doğrudan kendi API anahtarınızla yapılır
    • Örnek: Groq modeli kullanıldığında saat başına 0.02$ → aylık yaklaşık 0.20$ seviyesi (geleneksel SaaS'e kıyasla 100 kat daha ucuz)

Kurulum ve kullanım

  • macOS, Windows, Linux için ikili dosyalar sunulur
    • macOS: Apple Silicon/Intel sürümleri ayrı sunulur
    • Windows: MSI/EXE kurulum seçenekleri sunulur
    • Linux: AppImage, DEB, RPM desteklenir
  • Kurulumla uğraşmak istemeyenler için web uygulaması sürümü de vardır (ancak global kısayollar desteklenmez)

Veri işleme yöntemi

  • Tüm kayıtlar ve transkripsiyon sonuçları IndexedDB içinde saklanır ve yerel olarak yönetilir
  • Harici bir transkripsiyon hizmeti seçildiğinde yalnızca API anahtarıyla doğrudan çağrı yapılır
    • Sunucu aracılığı yoktur, veri toplama yoktur
  • Dönüşüm hizmetleri de yalnızca kullanıcının seçtiği LLM sağlayıcısına gönderilir
    • Dönüşüm iş akışları, istemler ve ayar değerleri yerelde saklanır

Farklılaştığı noktalar ve avantajlar

  • Mevcut transkripsiyon uygulamaları arada bir sunucu kullanıp aylık 15~30 dolar ücret alır
  • Whispering, aracısız yapısı sayesinde doğrudan sağlayıcıya bağlanarak maliyeti düşürür
  • Yerel seçenek tercih edildiğinde tamamen çevrimdışı, ücretsiz ve sınırsız kullanım mümkündür

Geliştirme ve mimari

  • Svelte 5 + Tauri tabanlıdır; hem masaüstü hem web desteği sunar
    • Yaklaşık 22MB boyut, hızlı açılış, minimum kaynak kullanımı
  • Kod tabanı servis katmanı, sorgu katmanı ve UI katmanı olarak ayrılmış bir 3 katmanlı mimariye sahiptir
    • Web ve masaüstü sürümleri arasında %97 kod paylaşımı vardır
  • Tarayıcı eklentisi (React + shadcn/ui) şu anda geçici olarak durdurulmuş durumda; odak masaüstü uygulamasını kararlı hale getirmekte

Katkı ve topluluk

  • Herkes kaynak kodunu inceleyebilir, özellik katkısı yapabilir, yeni transkripsiyon / yapay zeka hizmeti bağdaştırıcıları ekleyebilir
  • Geliştirme yönergeleri: TypeScript/Svelte kalıplarını koruma, WellCrafted kütüphanesi tabanlı hata işleme
  • Kullanıcı geri bildirimi ve iş birliği, Discord topluluğu ve GitHub Issues üzerinden yürütülür
  • MIT lisansı ile özgürce fork edilebilir, değiştirilebilir ve yeniden dağıtılabilir

SSS'den öne çıkan yanıtlar

  • Çevrimdışı kullanım mümkün mü?: Speaches yerel moduyla tamamen çevrimdışı desteklenir
  • Gerçek maliyet nedir?: Groq ile aylık 0.2~3$, OpenAI ile aylık 1.8~16.2$, yerelde ücretsiz
  • Güvenlik/gizlilik: Kayıtlar yerelde tutulur; dışarı aktarım yalnızca kullanıcının doğrudan seçtiği sağlayıcının API'sine yapılır
  • Desteklenen platformlar: macOS, Windows, Linux masaüstü + web tarayıcısı

Henüz yorum yok.

Henüz yorum yok.