19 puan yazan xguru 2022-11-17 | 3 yorum | WhatsApp'ta paylaş
  • Telefonumuz söylediklerimizi sürekli kaydedip yapay zekayla işlese ne olurdu? Önce ben denedim
  • Uyku dışında, uyanık olduğum süre boyunca sürekli kayıt alıyor (uygunsuz durumlarda bazen kapatıyorum). Bu bir PoC ve henüz gerçek kullanım için uygun değil
  • Bunu yapma motivasyonum, OpenAI'ın Whisper'ı açık kaynak olarak yayımlamasıydı

Nasıl çalışıyor

  • İki mikrofonla gün boyunca konuşulanları kaydediyorum, gün sonunda Whisper ile işleyip metne dönüştürüyorum
  • Bunu kullanarak basit düzeyde bir "Ok Google" tarzı dijital asistan yapılabileceğini fark ettim
  • Her gün çıkarılabilecek iki tür bilgi var
    • Active : asistana bilinçli olarak verdiğim komutlar
    • Passive : benim ayrıca bir aksiyon almama gerek kalmadan bilgi çıkarılması gereken diğer her şey

Active Functions

  • Her akşam eşzamansız işlenmesi gereken şeyleri 'KEYWORD COMMAND data END KEYWORD' biçiminde söylüyorum
    • 'Robert WEIGHT 60.1 end Robert' : Robert asistanın adı, end ise bitiş anahtar kelimesi
    • "OK Google" kullanmama nedenim: sınırlı olması, verilerin Google'a gitmesini istememem ve konuştuğum anda işleyen senkron bir yapı olması
    • Elbette eşzamansız işlendiği için gün bitmeden sonucu görememek gibi bir dezavantajı var

Sonuçları görmek

  • Tartının üstüne çıkınca 'Robert WEIGHT 62.8 end Robert'
  • Uyanınca uyku takip cihazını (Mi Band) okuyup 'Robert SLEEP 7 hours 14 minutes end Robert'
    • Cihazlar telefonla eşleşip veriyi iletiyor ama dışarı almanın bir yolu olmadığından, dijital asistanı adeta analog bir API gibi kullandım
  • Yemekten sonra 'Robert LUNCH two toasts with a fried egg end Robert'
    • Her gün yediğim yiyeceklerin kalorisini harici bir API ile hesaplıyor
  • Podcast dinledikten sonra 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
    • Notları ve fikirleri kaydediyor
  • Yakıt aldıktan sonra 'Robert SPENT 250,000 on fuel end Robert'
    • Günlük harcamalarımı kaydediyor
  • Kendi kendime konuşmak biraz garip hissettiriyor ama telefonu elime alıp bir şey yapma gereğini ortadan kaldırması bir avantaj

Kontrol paneli

  • Bu şekilde girilen tüm bilgileri görmek için bir dashboard hazırladım
  • My Journal oluşturarak bugün ne yaptığımı otomatik olarak kaydediyor

Passive Information - hâlâ üzerinde çalışılıyor

  • RELATIONSHIP THERMOMETER : ilişki termometresi
  • SENTIMENT ANALYSIS : duygu analizi
  • TOTAL RECALL: belirli bir konu hakkında konuşulan her şeyi arama ve o konu hakkında belli bir andaki düşüncelerimi bulma

Ön değerlendirme

  • Ses + bağlam gerekli
  • Bunun sağlayacağı potansiyel hem olumlu hem olumsuz açıdan muazzam
    • Olumlu: kusursuz hafıza, kişisel psikolog/koç, sanal klonum
    • Olumsuz: yukarıdakilerin başka insanların elinde olması
  • Ütopya ile distopya arasındaki fark, o bilgilere kimin erişebildiği

3 yorum

 
budlebee 2022-11-17

“Ütopya ile distopya arasındaki fark, o bilgiye kimin erişebildiğidir.” Güzel bir söz.

 
nicewook 2022-11-17

İlgi çekici. Bunun yeterince gerçeğe dönüşmesi mümkün görünüyor.
VLog gibi, zaman zaman örnek bir günlük yaşamı paylaşıp dağıtan içerikler de mümkün olabilir.

 
xguru 2022-11-17

Yazar bunu HN'ye bizzat göndermiş ve yorumlara da yazmış: https://news.ycombinator.com/item?id=33608437
Kullandığı mikrofonun AliExpress bağlantısını da eklemiş :)

Whisper - OpenAI'nin açık kaynak olarak yayımladığı çok dilli konuşma tanıma sistemi (ASR)