Mozilla Common Voice
(voice.mozilla.org)Herkesin kullanabileceği konuşma tanıma teknolojisini oluşturmak ve erişilebilir hale getirmek için çeşitli dillerde veri toplayıp düzenleyen açık kaynaklı bir ses veritabanı.
Korece için veri hâlâ oldukça yetersiz. Katılın ve birlikte oluşturalım.
Çoğu şirketin oluşturduğu ses veri setlerini dışarıda kullanmak zordur.
Bu yüzden açık olarak oluşturulan veriler önemlidir. Özellikle de Korece için çok daha fazla.
7 yorum
Hedef ayarlama kısmında Korece olmadığı için ilerleyemiyorum..
Demek ki Korece veri kümesi, cümle sitesinin yerelleştirilmesi ya da cümle seti hâlâ yetersiz olduğu için henüz mümkün değilmiş.
Site Türkçe çevirisi: https://pontoon.mozilla.org/projects/common-voice/
Cümle toplama sitesi: https://common-voice.github.io/sentence-collector
Görünüşe göre site çevirisi tamamlandıktan ve 5000'den fazla cümle toplandıktan sonra ses toplama ve doğrulama mümkün oluyor. İlgilenenlerin yoğun katılımını rica ederim.
Ben de aynı yorumu yazıp silmiştim hahaha
https://discourse.mozilla.org/t/…
Burada da öyle açıklanmış.
Ah.. evet haha ben de silmeye çalışırken silme düğmesi olmadığı için afalladım..
Bununla ilgili birkaç Korece korpus var gibi görünüyor ama telif hakkı sorunları yüzünden yükleyip yükleyemeyeceğimden emin değilim.
Ah, yorum silme işlemi için yorumun üst kısmında, kimliğin yanındaki zaman bağlantısına tıklarsanız yorum sayfası içinde silme işlemi yapılabilir.
Daha önce yayımlanmış Korece ses tanıma açık kaynak projesi olarak Kaldi'yi kullanan Zeroth projesi de var.
(GitHub içeriğine göre son model muhtemelen Temmuz 2018 sürümü gibi görünüyor.)
https://github.com/goodatlas/zeroth