- Spotify'nin Yapay Zeka DJ özelliği, klasik müziği doğru tanıyamayan örnekler üzerinden yapay zekanın sınırlarını ve müzik meta verisi sorunlarını ortaya koyuyor
- Kullanıcı “Beethoven'ın 7. Senfonisi”ni istediğinde, yapay zeka eserin yapısını ya da bölüm sırasını anlayamıyor ve alakasız bir bölüm ya da başka bir bestecinin eserini çalıyor
- “Tüm bölümleri sırayla çal” gibi açık bir komuta rağmen, yapay zeka yanlış senfoniyi veya sırası karışmış kayıtları seçerek tutarsız sonuçlar veriyor
- Bu hataların temel nedeni, dijital müzik meta verisinin pop müzik merkezli tasarlanmış olması ve besteci-eser-bölüm kavramlarını yansıtamaması
- Yazı, yapay zekanın “zekâsına” dair beklenti ile gerçeklik arasındaki uçuruma işaret ederek, Batı müzik geleneğinin korunmasının şirket kârıyla ilgisiz olduğu yönünde alaycı bir sonuca varıyor
Yapay Zeka DJ kullanım deneyimi ve sorunun fark edilmesi
- Yazı, “Yapay zeka gerçekten zeki mi?” sorusuyla başlıyor ve yapay zekanın hatalarından programcıların sorumlu olup olmadığı meselesini gündeme getiriyor
- Spotify uygulamasındaki Yapay Zeka DJ özelliği ile klasik müzik aramayı deneyerek, mevcut Spotify arama yapısının sınırlarını yeniden doğruluyor
- Yazar, pop müzik değil 500 yıllık Batı müzik geleneğini dinlemeyi seven bir kullanıcı olarak Tallis'ten Shaw'a uzanan bestecileri örnek veriyor
Dijital müzik meta verisinin yapısal sınırları
- Dijital müzik dosyalarının meta verisi Artist, Album, Song olmak üzere üç etiketten oluşuyor ve bu yapı pop müzik merkezli bir tasarım
- “Song” teriminin enstrümantal eserler için de kullanılan uygunsuz bir ifade olduğunu belirterek, klasik müzikte “composition” veya “work” kullanımının daha doğru olduğunu açıklıyor
- Klasik müziğin temel yapılarından biri olan ‘bölüm (movement)’ kavramı meta veriye yansımadığı için, Spotify eserin bütün yapısını tanıyamıyor
Beethoven'ın 7. Senfonisini çalma deneyi
- “Play Beethoven’s 7th Symphony” komutunda yapay zeka yalnızca 2. bölüm Allegretto'yu çalıyor ve ardından tamamen alakasız parçalar ekliyor
- “Play Beethoven’s 7th Symphony in its entirety” isteğinde de yapay zeka bunu yanlış biçimde “9 dakikalık tam eser” olarak algılıyor ve yine yalnızca 2. bölümü çalıyor
- “Play Beethoven’s 7th Symphony from beginning to end” komutunda da aynı şekilde sadece 2. bölüm çalınıyor, ardından John Field'ın eserine geçiliyor
- “Play all four movements” isteğinde ise 1. bölümden başlıyor ama farklı orkestraların kayıtları karışıyor ve sıra bozuluyor
- “Play all four movements in numerical order” komutunda ise 3. Senfoni'nin 1. bölümüyle başlaması gibi tamamen yanlış bir sonuç ortaya çıkıyor
Yapay zekanın müziği anlama yetersizliği
- Yapay zekanın eserin bölüm yapısını ya da sıra kavramını hiç anlamadığı vurgulanıyor
- Beethoven'ın senfonilerinin 4 bölümden oluştuğu bilgisi Wikipedia'nın ilk cümlesi okunarak bile anlaşılabilecek kadar temel olmasına rağmen, yapay zeka bunu yansıtamıyor
- Yazar bu hatayı, bir sesli kitabın son bölümünü önce okumaya benzeterek yapay zekanın cehaletini hicvediyor
Sonuç: Yapay zeka ile müzik geleneği arasındaki kopukluk
- Yapay zekanın müzik “besteleyebildiği” iddiasına kuşkuyla yaklaşıyor ve en temel kavramları bile anlamayan bir yapay zekanın yaratıcılıktan söz edemeyeceğini eleştiriyor
- Spotify DJ'in hâlâ beta aşamasında olduğunu kabul etmekle birlikte, şirketlerin Batı müzik geleneğini korumak için bir motivasyonu olmadığı yönündeki gerçekçi karamsarlıkla yazıyı bitiriyor
- Genel olarak mesele, yapay zeka teknolojisinin sınırları, meta veri tasarımındaki önyargı ve kültürel ilgisizliğin birleşimi olarak sunuluyor
1 yorum
Hacker News görüşleri
Bu AI sorunu değil, ürün tasarımı sorunu. Spotify DJ fiilen “shuffle + sesli anons” düzeyinde ve muhtemelen özellikle albümün tamamını çalmasını engelleyen bir kod bulunuyor
AI'ı tek bir kavram gibi genellemek yanlış bir yaklaşım. “Bu özellik çalışmıyorsa AI işe yaramaz” türü bir mantık kategori hatası (category error) sayılır
Yazının tamamı çeşitli görüşleri birbirine karıştırdığı için kafa dağıtıyor ve yarısı yalnızca klasik eser adlarını sıralamaktan ibaret. Spotify DJ'in kötü olduğuna katılıyorum ama bu ikna edici bir eleştiri biçimi değil
Teknolojinin artılarını ve eksilerini araştırma çabası yok; dar bir örnekten yola çıkıp tüm AI'ı küçümseme şeklindeki tipik yaklaşım bu. AI insan değil, dolayısıyla sınırları olması normal
AI kodlama yardımcılarında da benzerini gördüm. Güvenlik sorunlarını gerekçe gösterip her şeyi toptan reddediyorlar ama “tek cümleyle yerel Mac uygulaması yapma” ihtimalini görmezden geliyorlar
Hör Berlin gibi YouTube DJ mix'lerinin çekiciliği, DJ'in seçimi ve yorumu ile kültürel arka planından geliyor. AI'ın optimize edilmiş liste çıkarması bu özün kaybolmasına yol açıyor
Spotify maliyeti düşürmek için radyo tipi ve etkileşimli lisansları birlikte kullanıyor. AI'ın oluşturduğu çalma listesi kullanıcının doğrudan seçimi sayılmadığı için radyo tipi olarak değerlendirilmesi muhtemel
dublab, NTS1, NTS2 gibi yayınları sık dinliyorum; beklenmedik müziklerle karşılaşabiliyorsun
Yüz milyonlarca dolar yatırım yapılsa da kusursuz öneri mümkün olmadı ve insan DJ'lerin sosyal güvenini (social proof) ikame edemedi
Müzik konusunda da pop ve Batı klasik müziği dışında bir dünya yokmuş gibi yaklaşması üzücü
Ben bunu prompt tasarımı hatası olarak görüyorum. Aynı isteği ChatGPT örneği ile test edince AI doğru tepki veriyor
Yani Spotify'ın modeli zayıf olabilir ya da iç prompt'ları yanlış yöne sevk ediyor olabilir
“AI müzik besteleyemez” iddiası da yanlış bir kıyas. AI zaten müzik teorisini anlama ve beste yapabilme olasılığını göstermiş durumda. Sonuçta mesele kalite ve zevk meselesi
İnsanlar LLM'e her “AI” dediğinde algı çarpılıyor.
Bu, pazarlama dünyasının en büyük başarılarından biri ve dünyaya verdiği en büyük zararlardan biri olabilir