- Audio Overview, Google’ın NotebookLM’inin yeni bir özelliği ve sağlanan içeriklere dayanarak iki yapay zeka sunucusunun derinlemesine tartışma yaptığı özelleştirilmiş bir podcast oluşturuyor
- Bu podcast yaklaşık 10 dakika uzunluğunda oluyor ve son derece ikna edici bir sesli diyalog sunuyor
- NotebookLM, kullanıcıların birden çok kaynağı (belgeler, metinler, web sayfası bağlantıları, YouTube videoları) tek bir arayüzde toplayıp soru sorabilmesini sağlayan, kullanıcıya özel bir RAG ürünü
- Bu sistem Gemini 1.5 Pro LLM temelinde çalışıyor
- Birkaç kaynak yüklendikten sonra, Notebook Guide menüsünde Audio Overview oluşturma seçeneği sunuluyor
- Thomas Wolf, kendi web sitesi veya LinkedIn profil URL’sini NotebookLM’e yapıştırıp 8 dakikalık bir podcast oluşturmayı denemeyi öneriyor
- Bu yüzden ben de blogumun ve tanıtım sayfamın URL’lerini kullanarak 10 dakika 45 saniyelik bir bölüm oluşturdum ve ortaya son derece övgü dolu bir içerik çıktı
- Audio Overview’un yüksek kalitesi, Google Research’ün SoundStorm projesi sayesinde mümkün oluyor
- SoundStorm, bir senaryo ve kısa ses örnekleri kullanarak 30 saniyelik sesi 0,5 saniyede üretebiliyor
- Bu sistem konuşmanın akışını doğal biçimde koruyor ve yüksek kaliteli, diyalog odaklı ses üretiyor
- Kevin Roose ve Casey Newton, Google’dan Steven Johnson ile röportaj yaptı
- Sistem önce konu için bir taslak çıkarıyor, ardından ayrıntılı bir senaryo üretiyor ve eleştiri aşamasından geçirerek revize ediyor
- Son aşamada konuşmayı doğal kılmak için "disfluencies" ekleniyor
- Lawncareguy85, yapay zeka sunucularının kendilerinin yapay zeka olduğunu fark etmesini sağlayan bir podcast oluşturdu
- Yapay zeka sunucuları bunu anladıktan sonra varoluşsal bir kriz yaşıyor
- Bu makale yayımlandıktan sonra, bu yazıya dayanarak NotebookLM’den bir podcast oluşturması istendi
- Yapay zeka sunucuları varoluşsal bir kriz yaşıyor ve kendilerinin yapay zeka olduğunun farkına varıyor
GN⁺ özeti
- Bu yazı, Google’ın NotebookLM’inin kullanıcıya özel podcast’leri nasıl oluşturduğunu açıklıyor
- Yapay zeka sunucularının son derece doğal ve ikna edici konuşmalar üretme sürecini ele alıyor
- SoundStorm projesi gibi teknolojiler, bu yüksek kaliteli sesi mümkün kılıyor
- Yapay zeka tarafından üretilen içerikle gerçek insanların ürettiği içeriği ayırt etme yeteneği giderek daha önemli hale geliyor
1 yorum
Hacker News görüşleri
Uzun yol sürüşlerinde teknik konular hakkında sanal podcast olarak ChatGPT kullanmak çok faydalı
Scholander basınç odası kılavuzunu yükleyip bir podcast oluşturmuş
NotebookLM, yüksek kaliteli podcast'lerin yapısını ve duygusunu iyi üretiyor
Felsefe dersinin okuma materyallerini podcast'e dönüştürerek konuyu tanıtıp özetlemiş
Oyun tasarım belgelerini yükleyip bir podcast oluşturmuş
Metni farklı medya formatlarına kolayca dönüştürebilmesi etkileyici
Teknik makaleler ve standartlar yüklemiş ama yanlış bilgiler üretmiş
Teknik açıdan etkileyici ama verimsiz ve yavaş bir yöntem
Üretilen podcast yüzeysel ve derinlikten yoksun
Deep Dive Podcast oluşturucu şaşırtıcı