- Telefonumuz söylediklerimizi sürekli kaydedip yapay zekayla işlese ne olurdu? Önce ben denedim
- Uyku dışında, uyanık olduğum süre boyunca sürekli kayıt alıyor (uygunsuz durumlarda bazen kapatıyorum). Bu bir PoC ve henüz gerçek kullanım için uygun değil
- Bunu yapma motivasyonum, OpenAI'ın Whisper'ı açık kaynak olarak yayımlamasıydı
Nasıl çalışıyor
- İki mikrofonla gün boyunca konuşulanları kaydediyorum, gün sonunda Whisper ile işleyip metne dönüştürüyorum
- Bunu kullanarak basit düzeyde bir "Ok Google" tarzı dijital asistan yapılabileceğini fark ettim
- Her gün çıkarılabilecek iki tür bilgi var
- Active : asistana bilinçli olarak verdiğim komutlar
- Passive : benim ayrıca bir aksiyon almama gerek kalmadan bilgi çıkarılması gereken diğer her şey
Active Functions
- Her akşam eşzamansız işlenmesi gereken şeyleri
'KEYWORD COMMAND data END KEYWORD' biçiminde söylüyorum
'Robert WEIGHT 60.1 end Robert' : Robert asistanın adı, end ise bitiş anahtar kelimesi
- "OK Google" kullanmama nedenim: sınırlı olması, verilerin Google'a gitmesini istememem ve konuştuğum anda işleyen senkron bir yapı olması
- Elbette eşzamansız işlendiği için gün bitmeden sonucu görememek gibi bir dezavantajı var
Sonuçları görmek
- Tartının üstüne çıkınca
'Robert WEIGHT 62.8 end Robert'
- Uyanınca uyku takip cihazını (Mi Band) okuyup
'Robert SLEEP 7 hours 14 minutes end Robert'
- Cihazlar telefonla eşleşip veriyi iletiyor ama dışarı almanın bir yolu olmadığından, dijital asistanı adeta analog bir API gibi kullandım
- Yemekten sonra
'Robert LUNCH two toasts with a fried egg end Robert'
- Her gün yediğim yiyeceklerin kalorisini harici bir API ile hesaplıyor
- Podcast dinledikten sonra
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- Notları ve fikirleri kaydediyor
- Yakıt aldıktan sonra
'Robert SPENT 250,000 on fuel end Robert'
- Günlük harcamalarımı kaydediyor
- Kendi kendime konuşmak biraz garip hissettiriyor ama telefonu elime alıp bir şey yapma gereğini ortadan kaldırması bir avantaj
Kontrol paneli
- Bu şekilde girilen tüm bilgileri görmek için bir dashboard hazırladım
- My Journal oluşturarak bugün ne yaptığımı otomatik olarak kaydediyor
Passive Information - hâlâ üzerinde çalışılıyor
- RELATIONSHIP THERMOMETER : ilişki termometresi
- SENTIMENT ANALYSIS : duygu analizi
- TOTAL RECALL: belirli bir konu hakkında konuşulan her şeyi arama ve o konu hakkında belli bir andaki düşüncelerimi bulma
Ön değerlendirme
- Ses + bağlam gerekli
- Bunun sağlayacağı potansiyel hem olumlu hem olumsuz açıdan muazzam
- Olumlu: kusursuz hafıza, kişisel psikolog/koç, sanal klonum
- Olumsuz: yukarıdakilerin başka insanların elinde olması
- Ütopya ile distopya arasındaki fark, o bilgilere kimin erişebildiği
3 yorum
“Ütopya ile distopya arasındaki fark, o bilgiye kimin erişebildiğidir.” Güzel bir söz.
İlgi çekici. Bunun yeterince gerçeğe dönüşmesi mümkün görünüyor.
VLog gibi, zaman zaman örnek bir günlük yaşamı paylaşıp dağıtan içerikler de mümkün olabilir.
Yazar bunu HN'ye bizzat göndermiş ve yorumlara da yazmış: https://news.ycombinator.com/item?id=33608437
Kullandığı mikrofonun AliExpress bağlantısını da eklemiş :)
Whisper - OpenAI'nin açık kaynak olarak yayımladığı çok dilli konuşma tanıma sistemi (ASR)