Büyük dil modelleri dijital kamusal mallar için bir tehdit olabilir mi?

kuroneko · 2023-07-18T15:33:20+09:00

ChatGPT sonrası Stack Overflow etkinliği üzerinden, LLM'lerin web içeriği üzerindeki etkisine dair bir analiz. Stack Overflow'da ChatGPT sonrasında etkinlik %16 ila %25 azaldı. En çok kullanılan ve en popüler dillerde düşüş daha büyük. Bu oranlar, ChatGPT'nin engellendiği Çin ve Rusya'daki sitelerle ya da yapay zekanın ikame etmesinin zor olduğu matematikle ilgili sitelerle karşılaştırıldı. Gönderilere verilen oy sayısı değişmediği için, yanıt kalitesinin arttığı söylenemez. Bu, ChatGPT sonrasında insanlar tarafından üretilen verinin azaldığı anlamına geliyor. Buna bağlı olarak çeşitli sorunlar ortaya çıkabilir. İnternet genelindeki bilgi miktarı ve kalitesi azalabilir; yapay zeka eğitim verisinin verimliliği de düşebilir. ChatGPT verileri OpenAI'nin tekelinde olduğu için, şirketler arasındaki teknoloji farkı daha da açılabilir. İnsanların keşif alanı daralabilir ve yapay zekanın öğrenmediği yeni ürünlerin ya da dillerin gelişimi yavaşlayabilir. LLM'lerin faydalarından yararlanması zor olan ülkeler, gelir grupları ve diğer toplumsal katmanlar arasındaki uçurum daha da büyüyebilir. Sürdürülebilir bir web ve yapay zeka ekosistemi için üzerinde düşünülmesi gereken bir mesele.

(arxiv.org)

11 puan yazan kuroneko 2023-07-18 | 5 yorum | WhatsApp'ta paylaş

ChatGPT sonrası Stack Overflow etkinliği üzerinden, LLM'lerin web içeriği üzerindeki etkisine dair bir analiz.
Stack Overflow'da ChatGPT sonrasında etkinlik %16 ila %25 azaldı.
- En çok kullanılan ve en popüler dillerde düşüş daha büyük.
- Bu oranlar, ChatGPT'nin engellendiği Çin ve Rusya'daki sitelerle ya da yapay zekanın ikame etmesinin zor olduğu matematikle ilgili sitelerle karşılaştırıldı.
Gönderilere verilen oy sayısı değişmediği için, yanıt kalitesinin arttığı söylenemez.
Bu, ChatGPT sonrasında insanlar tarafından üretilen verinin azaldığı anlamına geliyor.
Buna bağlı olarak çeşitli sorunlar ortaya çıkabilir.
- İnternet genelindeki bilgi miktarı ve kalitesi azalabilir; yapay zeka eğitim verisinin verimliliği de düşebilir.
- ChatGPT verileri OpenAI'nin tekelinde olduğu için, şirketler arasındaki teknoloji farkı daha da açılabilir.
- İnsanların keşif alanı daralabilir ve yapay zekanın öğrenmediği yeni ürünlerin ya da dillerin gelişimi yavaşlayabilir.
- LLM'lerin faydalarından yararlanması zor olan ülkeler, gelir grupları ve diğer toplumsal katmanlar arasındaki uçurum daha da büyüyebilir.
Sürdürülebilir bir web ve yapay zeka ekosistemi için üzerinde düşünülmesi gereken bir mesele.

5 yorum

soupdog 2023-07-25

Dil modelleri Stack Overflow’un sağladığı iletişimin yerini alırken, insanların kendi aralarında iletişim kurup internette paylaştığı bilgi giderek azalıyor gibi görünüyor. Katedral ve çarşı metaforunu ödünç alırsak, tam anlamıyla birinin tekelinde olan bir katedrale dönüşüyor gibi.

laeyoung 2023-07-19

Endişe verici olmakla birlikte, benim kişisel olarak yaşadığım en büyük sorun, iktisatta söylenen “kötü para iyi parayı kovar” durumunun yaşanıyor olması.

ChatGPT çıkmadan önce Google reklam onayı almak için, geçen yılın sonu itibarıyla blogda yaklaşık 8 yazı yazmak yeterli oluyordu. Şimdi ise bunun iki katını yazsanız bile içerik yetersiz ya da geçersiz içerik denilerek onay verilmiyor. Üstelik hepsi elle yazılmış yazılar olmasına rağmen.

Yapay zeka ile otomatik üretilmiş bloglar çoğaldıkça AdSense onay kriterleri yükseldi ve bunun sonunun nereye varacağını da bilmiyoruz. Bu yüzden yaklaşık 3 aydır film incelemeleri yazdığım blog için AdSense onayı alma işinden vazgeçmiş durumdayım.

Denetleyen tarafta bunun iyi para mı (insanın yazdığı içerik), kötü para mı (yapay zeka ile yapılmış ya da yapay zeka ile yapılıp sonradan düzenlenmiş içerik) olduğunu ayırt edemedikleri için, muhtemelen kriterleri yükseltme yoluna gidecekler. Sonunda da bu yılın başında gördüğümüz gibi, yalnızca otomatik üretilmiş web sayfalarının Google arama sonuçlarında üst sıralarda göründüğü bir manzarayla karşılaşmayacak mıyız diye düşünüyorum.

cosine20 2023-07-19

Ben ise daha çok olumlu taraftan bakıyorum.
Geleneksel bilgi arama yöntemi iki şey gerektiriyordu: “arama motoruna uygun arama terimlerini girme becerisi” ve “arama sonuçları arasından benim istediğim sonucu seçip ayıklama becerisi.” Bunun yarattığı yorgunluk oldukça fazlaydı.
Sadece basit bir işi yapan bir kod bulmak istiyorsunuzdur; ama arama sonuçlarındaki StackOverflow yazısına girince üç dört farklı cevap kodu olur. Bunlardan bazısı eski dil spesifikasyonuna dayandığı için karmaşık bulunup downvote almıştır, bazısı kabul edilmiş cevaptır ama sürüm yükseltmeleriyle artık düzgün çalışmaz hale gelmiştir; yorumlarda da insanlar hararetle rahatsızlıklarını dile getirip kendi aralarında çözüm arıyordur. Bu tür şeyler sanılandan daha sık oluyordu.

Sonuçta büyük çerçeveden bakınca, bilişim çağından beri “bilgi seli içinde gerçekten istediğim bilgiyi seçip ayıklama becerisine” ihtiyaç duyulması değişmedi; ancak önümüze çıkan seçenekler fazlasıyla arttığı için karar vermek giderek daha zahmetli ve yorucu hale geliyor diye düşünüyorum.

Bu açıdan, iyi eğitilmiş büyük dil modelleri insanların sık aradığı son derece trivial bilgilerden belirli ölçüde daha üst düzey bilgilere kadar makul bir UX ile sunabildiği için, aksine belli ölçüde bir iş bölümü mümkün olabilir diye düşünüyorum.
LLM’lerin uygun yanıt üretmekte zorlandığı çok yeni bilgiler ya da çeşitli bağlamların karmaşık biçimde iç içe geçtiği sorular ise StackOverflow gibi soru-cevap servislerinin alanı olmaya devam eder.

Yine de LLM’lerin o ölçüde doğru bilgiyi açık dayanaklara göre seçip halka sunup sunamayacağı hâlâ çözülmesi gereken bir mesele gibi görünüyor.

kuroneko 2023-07-18

HN başlığı

Elbette bu, yalnızca bazı siteleri inceleyen ve bu yüzden önyargı payı yüksek olabilecek sınırlı bir araştırma,
ama sonuçta çeşitli açılardan teknoloji uçurumunun büyüyebileceği kısmı gerçekten riskli görünüyor.

Yorumlardan birinde, "AI, insanların yazdığı içeriğin değerinin ürettiği parayı AI şirketlerine yönlendirerek servetin yoğunlaşmasına yol açıyor" deniyordu,
bu bana da oldukça anlamlı geliyor.

jujumilk3 2023-07-18

Yok artık, emoji eklenmiyor. Katılıyorum.

Büyük dil modelleri dijital kamusal mallar için bir tehdit olabilir mi?

İlgili okumalar

5 yorum