14 puan yazan GN⁺ 2024-10-01 | 1 yorum | WhatsApp'ta paylaş
  • Audio Overview, Google’ın NotebookLM’inin yeni bir özelliği ve sağlanan içeriklere dayanarak iki yapay zeka sunucusunun derinlemesine tartışma yaptığı özelleştirilmiş bir podcast oluşturuyor
  • Bu podcast yaklaşık 10 dakika uzunluğunda oluyor ve son derece ikna edici bir sesli diyalog sunuyor
  • NotebookLM, kullanıcıların birden çok kaynağı (belgeler, metinler, web sayfası bağlantıları, YouTube videoları) tek bir arayüzde toplayıp soru sorabilmesini sağlayan, kullanıcıya özel bir RAG ürünü
    • Bu sistem Gemini 1.5 Pro LLM temelinde çalışıyor
    • Birkaç kaynak yüklendikten sonra, Notebook Guide menüsünde Audio Overview oluşturma seçeneği sunuluyor
  • Thomas Wolf, kendi web sitesi veya LinkedIn profil URL’sini NotebookLM’e yapıştırıp 8 dakikalık bir podcast oluşturmayı denemeyi öneriyor
    • Bu yüzden ben de blogumun ve tanıtım sayfamın URL’lerini kullanarak 10 dakika 45 saniyelik bir bölüm oluşturdum ve ortaya son derece övgü dolu bir içerik çıktı
  • Audio Overview’un yüksek kalitesi, Google Research’ün SoundStorm projesi sayesinde mümkün oluyor
    • SoundStorm, bir senaryo ve kısa ses örnekleri kullanarak 30 saniyelik sesi 0,5 saniyede üretebiliyor
    • Bu sistem konuşmanın akışını doğal biçimde koruyor ve yüksek kaliteli, diyalog odaklı ses üretiyor
  • Kevin Roose ve Casey Newton, Google’dan Steven Johnson ile röportaj yaptı
    • Sistem önce konu için bir taslak çıkarıyor, ardından ayrıntılı bir senaryo üretiyor ve eleştiri aşamasından geçirerek revize ediyor
    • Son aşamada konuşmayı doğal kılmak için "disfluencies" ekleniyor
  • Lawncareguy85, yapay zeka sunucularının kendilerinin yapay zeka olduğunu fark etmesini sağlayan bir podcast oluşturdu
    • Yapay zeka sunucuları bunu anladıktan sonra varoluşsal bir kriz yaşıyor
  • Bu makale yayımlandıktan sonra, bu yazıya dayanarak NotebookLM’den bir podcast oluşturması istendi
    • Yapay zeka sunucuları varoluşsal bir kriz yaşıyor ve kendilerinin yapay zeka olduğunun farkına varıyor

GN⁺ özeti

  • Bu yazı, Google’ın NotebookLM’inin kullanıcıya özel podcast’leri nasıl oluşturduğunu açıklıyor
  • Yapay zeka sunucularının son derece doğal ve ikna edici konuşmalar üretme sürecini ele alıyor
  • SoundStorm projesi gibi teknolojiler, bu yüksek kaliteli sesi mümkün kılıyor
  • Yapay zeka tarafından üretilen içerikle gerçek insanların ürettiği içeriği ayırt etme yeteneği giderek daha önemli hale geliyor

1 yorum

 
GN⁺ 2024-10-01
Hacker News görüşleri
  • Uzun yol sürüşlerinde teknik konular hakkında sanal podcast olarak ChatGPT kullanmak çok faydalı

    • Sunucunun "yetenek seviyesini" ayarlayabilmeyi umuyor
    • Yalnızca Signals and Threads podcast'i ilgi çekici bir derinlik sunuyor
  • Scholander basınç odası kılavuzunu yükleyip bir podcast oluşturmuş

    • Bilgiler doğru ve hafif şakalarla önemli konuları içeriyor
    • İnsan müdahalesi olmadan birkaç dakika içinde üretilmesi şaşırtıcı
  • NotebookLM, yüksek kaliteli podcast'lerin yapısını ve duygusunu iyi üretiyor

    • Bu, yapay zekanın şu anda sanat, müzik ve videoyu taklit etmesine benziyor
    • Birçok insan kaliteyi önemsemiyor
    • Bugün yayımlanan birçok kitap, fikir aktarmaktan çok başka amaçlara hizmet ediyor
    • Yazı, podcast ve müzikte kalite zaten ikincil olduğu için yapay zekanın bozmasına açık
  • Felsefe dersinin okuma materyallerini podcast'e dönüştürerek konuyu tanıtıp özetlemiş

    • 30 sayfalık bir PDF'yi okumak göz korkutucu olduğunda yardımcı oluyor
    • Egzersiz veya işe gidip gelirken daha kolay erişilebilen bir ses formatı sunuyor
    • Spotify'a yükleyip sınıf arkadaşlarıyla paylaşmış
  • Oyun tasarım belgelerini yükleyip bir podcast oluşturmuş

    • Sunucular fikirleri çok içgörülü bilgiler gibi ele alıyor
    • Birden fazla belge yükleyince aşırı şaşırmış tona sahip olduklarını fark ediyorsunuz
  • Metni farklı medya formatlarına kolayca dönüştürebilmesi etkileyici

    • Apple'ın metin okuma aracını kullanarak Wikipedia makaleleri dinlemiş ama ilgi çekici bulmamış
    • Gerçek podcast'ler, sunucu ve konukların kişiliği sayesinde başarılı oluyor
    • Notebook'un bir sonraki sürümünde konuşmacıların sesi, tonu, eğitim seviyesi gibi şeylerin daha fazla özelleştirilebilmesini umuyor
  • Teknik makaleler ve standartlar yüklemiş ama yanlış bilgiler üretmiş

    • İç inceleme veya manuel notlarla düzeltilebilir
    • Araştırmacıların yeni ifade yolları bulmasına yardımcı olabilir
    • 10 yıldan uzun süredir araştırdığı bir konuda yeni konuşma başlıkları sunuyor
  • Teknik açıdan etkileyici ama verimsiz ve yavaş bir yöntem

    • İlginç veya karşı çıkılabilecek görüşler yok
    • Öğrenilebilecek uzmanlık bilgisi yok
    • Değeri yok
  • Üretilen podcast yüzeysel ve derinlikten yoksun

    • Orta karar bir podcast üretiyor ama gerçek bir derinlik yok
  • Deep Dive Podcast oluşturucu şaşırtıcı

    • 38 sayfalık bir PDF'den 40 dakikalık bir podcast üretmiş ama ortalarda çok fazla tekrar eden içerik var
    • Belgede "içindekiler" olduğu için onu iki kez işlemiş olabilir