1 puan yazan GN⁺ 2023-12-08 | 1 yorum | WhatsApp'ta paylaş

Mozilla Common Voice projesine giriş

  • Mozilla Common Voice, makinelerin gerçek insanların nasıl konuştuğunu öğrenmesine yardımcı olan bir projedir.
  • Ses teknolojilerini kullanılabilir hale getirmek için geliştiricilerin çok büyük miktarda ses verisine ihtiyacı vardır.
  • Verilerin çoğu büyük şirketler tarafından kullanılır ve insanların büyük kısmı bunlara erişemediği için bunun inovasyonu engellediği düşünülmektedir.

Ses verisi kaydı ve doğrulama durumu

  • Bugüne kadar 29.000 saatlik ses kaydedildi ve bunun 18.000 saati doğrulandı.

Farklı dil desteği

  • Common Voice projesi dünya genelinde çeşitli dilleri destekler ve kullanıcılar kendi dillerinde katkıda bulunabilir.

Yüksek kaliteli açık veri kümesi oluşturmayı destekleme

  • Profil oluşturmadan da katkıda bulunabilirsiniz, ancak anonim demografik veriler sağlayarak gönderilen verileri daha zengin hale getirebilirsiniz.
  • Profil bilgileri, ses tanıma doğruluğunu eğitmek için kullanılan ses verisinin kalitesini artırır.
  • Kullanıcılar farklı diller genelinde kendi ilerlemelerini ve metriklerini takip edebilir.
  • Dünya çapındaki diğer katkıda bulunanlarla ilerlemelerini karşılaştırabilir.
  • Kişisel ve proje hedeflerindeki ilerlemeyi görebilir.
  • İsterlerse proje güncellemeleri ve yeni bilgiler için e-posta listesine isteğe bağlı olarak katılabilir.

GN⁺ görüşü

Bu yazıdaki en önemli nokta, Mozilla'nın ses tanıma teknolojisi geliştirmek isteyen geliştiricilere gerekli büyük ölçekli ses verisini sağlamak için Common Voice projesini başlatmış olmasıdır. Bu proje, Mozilla'nın teknolojik inovasyonu teşvik etme çabasını gösterirken, dünya genelindeki çeşitli dilleri destekleyerek çok sayıda insana teknolojik gelişime katkıda bulunma fırsatı sunuyor. Bu da Mozilla'nın teknolojinin demokratikleşmesini hedefleyen felsefesini yansıtıyor ve birçok kişi için ilgi çekici, cazip bir girişim olabilir.

1 yorum

 
GN⁺ 2023-12-08
Hacker News görüşü
    • FF’nin TTS’si, kullanımı kolay bir metinden konuşmaya sistemi isteyenler için önemli bir proje. Tarayıcıya gömülü olduğu için konsolda basit bir kod çalıştırarak çeşitli TTS örnekleri dinlenebiliyor. Bazı tarayıcılarda bu çevrimdışı da mümkünken, diğerleri bulut tabanlı TTS sistemleri kullanıyor.
    • Common Voice Android, projeye katkıda bulunmak isteyenler için faydalı bir uygulama. Kullanıcılar konuştukları dilde ses kaydı yapabiliyor ve diğer kullanıcıların katkılarını doğrulayabiliyor. Resmî web sitesi sürümüne göre daha kullanıcı dostu bir tasarıma sahip.
    • Mahkeme, OpenAI gibi şirketlerin eylemlerinin adil kullanım kapsamına girmediğine karar verirse, crowdsourcing ile oluşturulan veri kümeleri temel modeller kurmanın tek yolu olabilir. Böyle bir senaryonun gerçekleşme olasılığını düşük görmüyorum.
    • Bu veri kümesi, son dönemdeki ses modellerinin eğitildiği veri kümelerine kıyasla çok daha küçük; ancak self-supervised learning’den ziyade supervised learning için tasarlanmış ve belirli dillerde model performansını artırmaya yönelik ince ayar için hâlâ faydalı.
    • Yapay zeka ve deepfake teknolojileriyle ilgili son olaylar düşünüldüğünde, böyle bir projede “sesimi bağışlıyorum” demeden önce ne tür güvenceler gerektiği sorgulanmalı. Projenin ses tanıma için mi yoksa üretim için mi olduğu net değil.
    • Mozilla’nın ilgili speech-to-text yazılımını iptal edip etmediğini ya da başka bir şirkete devredip devretmediğini merak ediyorum. Yoksa o başka bir şey miydi?
    • Linux Firefox’un okuyucu modundaki metinden konuşmaya özelliği neden bu kadar kötü? Stephen Hawking’in metinden konuşmasına kıyasla bile çok daha kötü.
    • OpenAI’nin gerçekten açık olmasını umuyordum, ama artık Microsoft’un kuklası hâline gelip kurumsal kâr hedeflerinin peşinden gidiyor. Bu ve HuggingFace gibi projeleri görmek güzel; umarım HuggingFace de GitHub gibi Microsoft tarafından satın alınmaz.
    • Buradaki kişiler arasında “okuma sesi” ile günlük konuşma sesi farklı olan kaç kişi var? Eğitim verilerinin çoğu “senaryo okunuyormuş gibi” geliyorsa, konuşma odaklı modeller gerçekten eğitilebilir mi?
    • İlgili haber bağlantıları da verilmiş; bunlar Mozilla Common Voice projesinin ilerleyişi ve ses veri kümesinin genişlemesi hakkında bilgi sunuyor.