5 puan yazan xguru 2019-12-06 | 7 yorum | WhatsApp'ta paylaş

Herkesin kullanabileceği konuşma tanıma teknolojisini oluşturmak ve erişilebilir hale getirmek için çeşitli dillerde veri toplayıp düzenleyen açık kaynaklı bir ses veritabanı.

Korece için veri hâlâ oldukça yetersiz. Katılın ve birlikte oluşturalım.

Çoğu şirketin oluşturduğu ses veri setlerini dışarıda kullanmak zordur.

Bu yüzden açık olarak oluşturulan veriler önemlidir. Özellikle de Korece için çok daha fazla.

7 yorum

 
sduck4 2019-12-06

Hedef ayarlama kısmında Korece olmadığı için ilerleyemiyorum..

 
sduck4 2019-12-06

Demek ki Korece veri kümesi, cümle sitesinin yerelleştirilmesi ya da cümle seti hâlâ yetersiz olduğu için henüz mümkün değilmiş.

 
sduck4 2019-12-06

Site Türkçe çevirisi: https://pontoon.mozilla.org/projects/common-voice/

Cümle toplama sitesi: https://common-voice.github.io/sentence-collector

Görünüşe göre site çevirisi tamamlandıktan ve 5000'den fazla cümle toplandıktan sonra ses toplama ve doğrulama mümkün oluyor. İlgilenenlerin yoğun katılımını rica ederim.

 
xguru 2019-12-06

Ben de aynı yorumu yazıp silmiştim hahaha

https://discourse.mozilla.org/t/…

Burada da öyle açıklanmış.

 
sduck4 2019-12-06

Ah.. evet haha ben de silmeye çalışırken silme düğmesi olmadığı için afalladım..

Bununla ilgili birkaç Korece korpus var gibi görünüyor ama telif hakkı sorunları yüzünden yükleyip yükleyemeyeceğimden emin değilim.

 
xguru 2019-12-06

Ah, yorum silme işlemi için yorumun üst kısmında, kimliğin yanındaki zaman bağlantısına tıklarsanız yorum sayfası içinde silme işlemi yapılabilir.

 
xguru 2019-12-06

Daha önce yayımlanmış Korece ses tanıma açık kaynak projesi olarak Kaldi'yi kullanan Zeroth projesi de var.

(GitHub içeriğine göre son model muhtemelen Temmuz 2018 sürümü gibi görünüyor.)

https://github.com/goodatlas/zeroth