10 puan yazan xguru 2024-04-11 | 5 yorum | WhatsApp'ta paylaş
  • FFMPEG/QEMU'yu geliştiren Bellard'ın yeni projesi
  • TSAC, 44.1kHz'te mono 5.5kb/s veya stereo 7.5kb/s gibi son derece düşük bit hızlarına ulaşırken iyi ses kalitesi sunan bir ses sıkıştırma yardımcı programı
  • TSAC, 3.5 dakikalık bir stereo şarkıyı 192KiB boyutunda bir dosyaya sıkıştırabiliyor
  • Hızlı çalışması için Nvidia GPU gerekiyor; yalnızca CPU da destekleniyor ancak yavaş çalışıyor

Teknik bilgiler

  • TSAC, stereo için genişletilmiş Descript Audio Codec'in değiştirilmiş bir sürümüne ve sıkıştırma oranını daha da artırmak için bir Transformer modeline dayanıyor. Her iki model de parametre başına 8 bit olarak kuantize edilmiş
  • Transformer modeli deterministik ve yeniden üretilebilir şekilde değerlendirildiği için sonuçlar, kullanılan GPU veya CPU modeline ya da yapılandırılan iş parçacığı sayısına bağlı değil. Yani sıkıştırılmış dosyalar farklı donanım veya yazılım yapılandırmaları kullanılarak açılabiliyor.

5 yorum

 
botplaysdice 2024-04-11

Ana sayfasına bakınca bir ara LLM’e de ilgi duyduğu görülüyordu;;;; Böyle biri böyle en yeni teknolojiye mi? diye düşünürken, gerçekten de yapay zekanın ana akım olduğunu hissettim.

 
xguru 2024-04-11

Eskiden hakkında yazdığım canavar gibi adam Fabrice Bellard tanıtımını güncelleyecek olursam..

Fabrice Bellard

1989'da LZEXE'yi geliştirdi

1996'da Harissa'yı geliştirdi - bir Java Virtual Machine ve aynı zamanda Java'dan C koduna derleyici

1997'de, ikilik gösterimde pi'nin (π) belirli bir basamağındaki değeri bulmaya yarayan bir formül yayımladı.
-> Önceki basamakları hiç hesaplamadan hesaplama yöntemi. 1 trilyonuncu basamak "1"
https://en.wikipedia.org/wiki/Bellard%27s_formula

1998'de TinyGL'yi yayımladı - küçük ve gömülebilir bir OpenGL implementasyonu

2000'de FFMpeg'i yayımladı. Şu anda izlediğimiz video oynatıcıların büyük kısmı bunu kullanıyor.

2000'de, en büyük asal sayıyı bulan 448 baytlık C koduyla IOCCC'yi kazandı. Bu asal sayı 2016'ya kadar bulunan en büyük asal sayıydı.

2001'de Tiny C Compiler'ı yayımladı - ultra hafif bir C derleyicisi

2002'de QEmacs'i yayımladı - ultra hafif bir Emacs klonu. HTML/XML/CSS2 WYSIWYG render etme ve düzenleme mümkün (kendi tarayıcı motoru gömülü)

2003'te QEMU'yu yayımladı - donanım sanallaştırma özelliklerine sahip bir CPU emülatörü

2004'te TinyCC Boot Loader'ı yayımladı - Linux çekirdeğini doğrudan derleyip önyükleyebilen bir boot loader

2005'te DVB-T sinyal üretecini yayımladı: pahalı vericiler yerine masaüstünden dijital TV yayını yapılabiliyor. Bunun kaynak kodu yayımlanmadı.

2009'da pi'nin virgülden sonraki 2,7 trilyon basamağını hesaplayarak dünya rekoru kırdı. Bunu kendi masaüstü bilgisayarında 131 gün boyunca hesapladığını söyledi.
-> Büyük sayılara ilgiden çok, sadece bir bilgisayar programlama meydan okuması için yaptığını belirtti.

2011'de JSLinux'u yayımladı. Web tarayıcısında çalışan Linux'u tanıttı.

2019'da QuickJS JavaScript Engine küçük, hızlı ve gömülebilir bir JavaScript motoru yayımlandı

2022'de gpt2tc(GPT-2) kullanılarak oluşturulan SaaS olan TextSynth yayımlandı

Bunun dışında, JPG'den daha iyi sıkıştırma oranına sahip HEVC tabanlı görüntü formatı BPG'yi geliştirdi (JavaScript decoder sağladığı için her tarayıcıda kullanılabiliyor)

4G LTE/5G NR base station'ı PC tabanlı olarak düşük maliyetle hayata geçirdi ve bunu kendi şirketi Amarisoft üzerinden ticarileştirdi

Yaptığı her işte, bunun nasıl tek bir kişinin işi olabildiğine sadece hayret ediyorsunuz.

 
mdisprgm 2024-04-11

Vay..

 
botplaysdice 2024-04-11

Bir gün HN'de bu kişinin yazdığı kodla ilgili bir gönderide...

Birisi, "Bellard bunu neden burada (HN) paylaşmıyor?" diye sormuştu; buna da "Bu kadar üretken biri buraya gelip yazı mı yazar" gibi cevaplar gelmişti... haha

Gerçekten bir canavar....

 
xguru 2024-04-11

Hacker News görüşleri

Özet:

  • Bellard'ın yeni ses kodeği TSAC hakkında çok sayıda olumlu tepki var. Özellikle düşük bitrate'teki performansının mevcut kodeklere kıyasla üstün olduğu belirtiliyor.
  • TSAC'in sıkıştırılmış dosyası bozulduğunda ilginç sonuçlar ortaya çıkıyor. Fast modu ile normal modun sesi birbirinden farklı.
  • Gerçek zamanlı işleme için NVIDIA GPU gerekiyor ve mobil cihazlarda decode işlemi yük oluşturabilir. Düşük donanımlı gömülü sistemlerde kullanımı muhtemelen sınırlı olur.
  • TSAC decoder'ının sıkıştırılmış dosya boyutunun 237MB olması şaşkınlık yaratıyor. Decoder'ın içine ses örneklerinin dahil edilmiş olup olmadığı sorgulanıyor.
  • Codec2 gibi daha düşük bitrate destekleyen kodeklerle karşılaştırması merak ediliyor.
  • DAC'in (TSAC'in temel aldığı kodek) geliştiricisinden TSAC hakkında bir yorum geldi. Transformer kullanan iyileştirme yaklaşımı ilgi çekici bulunuyor.
  • TSAC'in çalışma biçimi, yapay zeka müzik üretim modellerine benziyor. Bazıları müzik üretmek için token'ları bir dil modeline veriyor; bazıları ise tokenizasyonun yerine Diffusion modelleri için sürekli bir gösterim sağlıyor.
  • TSAC için deterministik ve yeniden üretilebilir değerlendirme yöntemi konusunda soru işaretleri var. Floating point ve eşzamanlılıktan yararlanıp yararlanmadığı merak ediliyor. AMD GPU'ya port etmenin deterministik davranışı etkileyebileceği düşünülüyor.
  • Medya sıkıştırma teknolojilerinin çoğu düşük bitrate senaryolarına odaklanıyor. Yüksek bitrate'te iyileşmenin ne kadar olacağı merak ediliyor; örneğin 256kbps AAC'ye kıyasla AV1'in 10Mbps performans farkı gibi.