2 puan yazan GN⁺ 2024-08-10 | 3 yorum | WhatsApp'ta paylaş
  • Kayıtlı röportajları kolayca deşifre etmeyi sağlayan ücretsiz bir "web uygulaması"
  • Başlıca özellikler
    • Video oynatıcı ile belge düzenleyici arasında geçiş yapmaya gerek yok. Doğrudan tarayıcıda çalışır
    • Klavyeden elinizi çekmeden duraklatma, geri sarma ve ileri sarma yapılabilir
    • Etkileşimli zaman damgalarıyla deşifre metni içinde kolayca gezinebilirsiniz
    • Her saniye tarayıcı depolamasına otomatik kaydedilir
    • Gizlilik odaklıdır; ses dosyaları ve deşifre metinleri bilgisayarınızdan çıkmaz
    • Markdown, düz metin ve Google Docs olarak dışa aktarılabilir
    • Entegre oynatıcı üzerinden video dosyalarını destekler
    • MIT lisansı altında açık kaynaktır

GN⁺ özeti

  • oTranscribe, röportaj kayıtlarını deşifre etme sürecini sadeleştiren ücretsiz bir web uygulamasıdır
  • Kullanıcılar klavyeden ellerini çekmeden sesi kontrol edebilir ve deşifre metni her saniye otomatik olarak kaydedilir
  • Uygulama gizliliğe önem verir; ses dosyaları ve deşifre metinleri bilgisayarınızdan çıkmaz
  • Markdown, düz metin ve Google Docs dışa aktarma desteği sunarak deşifre metinlerini farklı biçimlerde kullanmayı mümkün kılar
  • Benzer işlevler sunan diğer projeler arasında Express Scribe ve TranscribeMe bulunur

3 yorum

 
xguru 2024-08-11

Hımm? Tarayıcıda bunun nasıl mümkün olduğunu merak etmiştim ama.. meğer yapay zeka olmadan, sadece dinleyip elle yazıya geçirmeye yarayan bir araçmış.
Son zamanlarda Whisper ile Korece tanıma da oldukça iyi çalışıyor; illa böyle bir şey kullanmak için özel bir neden var mı ki..

 
znjadong 2024-08-14

Konuşmacı sayısı fazla olduğunda, telaffuz net olmadığında ya da kayıt kalitesi düşük olduğunda yapay zekadan yardım almak zor olabilir. Ayrıca bazen sadece 'yeterince iyi' çalışmasından daha yüksek bir kaliteye ihtiyaç duyulur.

 
GN⁺ 2024-08-10
Hacker News görüşleri
  • Röportajı transkribe etmek için MahmoudAshraf97'nin Whisper-diarization aracını kullandı

    • Birden fazla konuşmacının sözlerini konuşmacı numaralarına göre ayırarak dosya oluşturuyor
    • Zaman damgalı dosya da oluşturuyor; bu dosya altyazı olarak kullanılabiliyor
  • OTranscribe, otomatik konuşma tanıma aracı değil; manuel transkripsiyona yardımcı olan bir arayüz

  • Gerçek zamanlı, kelime düzeyinde transkripsiyon yapan, yerelde çalışan ve en yeni açık kaynak modelleri kullanabilen bir uygulama arıyor

    • Şu anda otter.ai kullanıyor ancak internet bağlantısı gerektiriyor ve transkripsiyonda gecikme sorunu var
    • Whisper tabanlı uygulamalar tüm kaydı tek seferde işlemek zorunda
    • Apple'ın konuşma tanıma framework'ü şu anda biraz yetersiz
  • Yapay zeka entegrasyonu olmaması şaşırtıcı

    • Yapay zeka sonuçları da yayın kalitesi için inceleme ve QA gerektiriyor
    • Konuşmacı tanımlama, alışılmadık soyadlarını düzeltme gibi işler gerekiyor
  • oTranscribe, sesi otomatik olarak metne dönüştürmüyor

    • Manuel transkripsiyonu daha az zahmetli hale getiren bir araç
  • TurboScribe hizmetini öneriyor

    • Günde en fazla 3 dosya ücretsiz transkripsiyon yapıyor (dosya başına 30 dakika)
    • Ücretli planda dosya başına en fazla 10 saate kadar transkripsiyon mümkün
    • Konuşmacı tanıma, çeşitli dışa aktarma formatları desteği ve yapay zeka araçları içeriyor
  • Gemini-1.5-Pro-Experiment-0801 kullanarak röportaj transkripsiyonu denemesi yaptı

    • Sonuç neredeyse kusursuz
    • Belirli kelimeleri tırnak içine alması etkileyiciydi
  • Aiko'nun ücretsiz iOS uygulamasını kullanıyor

    • OpenAI'nin Whisper modelini kullanıyor
    • SRT, TXT, CSV, JSON gibi formatlara dışa aktarabiliyor
  • Whisper ve pyannote kullanan bir macOS açık kaynak uygulaması geliştiriyor

    • Özellikler var ama hız yavaş
    • Pyannote'u CoreML'e dönüştürmekte zorlanıyor
    • Katkılar memnuniyetle karşılanır
  • Yapay zeka içeren bir araç geliştiriyor

    • YouTube'dan indiriyor, Vosk ile transkribe ediyor, pyannote ile konuşmacıları ayırıyor
    • Transkripsiyon içeriğini arama motorunda saklıyor, web uygulamasının yapılması gerekiyor
    • İş birliği umuyor