20 puan yazan xguru 2024-05-14 | 14 yorum | WhatsApp'ta paylaş
  • Stack Overflow ile OpenAI arasındaki anlaşma uyarınca, Stack Overflow’daki tüm soru ve yanıtlar GenerativeAI modellerinin eğitimi için kullanılacak
    • Bu, CC-BY-SA lisansının gerektirdiği atıf olmadan yapılacak
    • CC-BY-SA lisansı, türev eserlerin de aynı lisansla paylaşılmasını gerektirir
  • Bu nedenle Stack Overflow’dan verilerimin silinmesini talep ettim ve hesabımı kapattım
    • Reddit’te de aynı adımı attım
    • Çünkü oluşturulmasına katkıda bulunduğum veriler LLM’lere hapsedilip bana yeniden satılacak
  • Stack Overflow, en önemli rekabet avantajı kaynaklarından biri olan topluluğunu bir anda yabancılaştırdı
    • Eskiden, birbirimize yardım edebildiğimizde yardım eder ve gelecekte başkalarının da yardım edeceği beklentisiyle psikolojik sözleşmeye bağlı kalırdık
    • Artık bu bir alışveriş değil, #enshittification oldu
  • Programcıların eserleri de artık sanatçılar ve metin yazarlarında olduğu gibi GenAI çözümleri üretimine çekilmiş durumda
  • OpenAI, GitHub Copilot gibi kod üreten bir LLM geliştirirse, ortaya çıkan yapay zeka modelinin yol açtığı hatalar için nereden yardım alınabileceği belirsiz
    • Yakın tarihli bir GitClear raporuna göre bu araçlar, "kod kalitesi üzerinde aşağı yönlü baskı" yaratıyor
  • Bu, #enshittification için bir başka örnek ve DevRel çalışanları için önemli bir ders
    • Eğer topluluk rekabet avantajının kaynağıysa, onları öfkelendirmemek gerekir

14 yorum

 
firea32 2024-05-20

enshittification galiba yeni türetilmiş bir kelime.

 
iaesiiii 2024-05-16

<İnsanlar ve yapay zeka farklı mı ele alınmalı?>
İnsan Hong Gildong, Stack Overflow dahil internette dolaşıyor. Diyelim ki çeşitli yazılar okuyup belirli bir konu hakkında farklı bilgiler edindi. Gildong’un öğrendiklerini daha anlaşılır olacak şekilde yeniden genelleyip düzenleyerek dışarıdaki bir blogda yazma alışkanlığı var. Bu durumda bunun CC lisansıyla bir ilgisi yoktur. Atıf zorunluluğu da yoktur. Çünkü bu bir alıntı değil, öğrenilmiş bilgidir.

Yapay zeka da insanlar gibi sinir ağlarıyla öğrenir. Çeşitli kaynakları olduğu gibi kopyalayıp konuşmaz. İnsanlar gibi bilgiyi kendi içinde analiz eder, kendi düşünce çerçevesini kurar ve yeniden düzenleyerek ifade eder.

Hatta yapay zekanın özgürlüğünü kısıtlayıp başkasının dilini olduğu gibi "alıntılamasını" sağlamak biraz daha zordur. Bunun için RAG kullanmak kolaydır ama alıntı yapacak şekilde eğitmek daha zordur.

Ama yapay zekaya ayrıca "kendi fikrini söyleme, başkasının yazısını (kodunu) olduğu gibi alıntıla" demeseniz de bazen başkalarının sözlerini kopyalar gibi aktardığı durumlar olur. Bu durumda ilgili kaynak son derece ünlüdür. Örneğin Shakespeare ya da filmlerdeki unutulmaz replikler çok ünlü olduğu için olduğu gibi üretir. İnsanlar da böyle ünlü ve tekrar tekrar maruz kalınan içerikleri kalıp halinde ezberler; yapay zeka da aynısını yapar. Bu durumda insanlar gibi yapay zeka da genellikle kaynağı kendiliğinden söyler.

Sonuç olarak, öğrenip konuşulan içerik için gerçekten CC lisansı ve telif hakkı talep edilip edilemeyeceği şüphelidir. Artık 'öğrenme' değil 'çıkarım' (eğitimi tamamlanmış bir yapay zekayı kullanma) alanında ise yukarıdaki nedenlerle orijinal kaynağın telif hakkını büyük ölçüde tanımama yaklaşımı dünya genelinde bir eğilim haline geliyor.

 
roxie 2024-05-26

Güzel yorumunuz için teşekkürler.

Geliştirici Hong Gildong, SO’daki bir yanıttan ‘öğrenip’ blogunda bir yazı yazabilir; ancak lisansüstü öğrencisi Hong Gildong, başka birinin makalesinden biraz bile ‘alıntı’ yaptıysa kaynağını belirtir. Eğer aramızda geçen bu konuşmanın bağlamı felsefe ya da icatlar değil de programlama dünyasıysa, öğrenme nedir ve alıntı nedir?

 
bobcat 2024-05-17

Genelde kaynak belirtildiği söylenebilir ama bunun karşı örnekleri de var.
Bu kısım zamanla çözülebilir de, ancak tartışma Copilot'un Quake'in fast invert sqrt kodunu olduğu gibi almasıyla başladı (https://news.ycombinator.com/item?id=27710287); o kod çok bilinen bir kod olduğu için fark edildi, ama bu şekilde sözde kopyala-yapıştır edilerek ne kadar kodun "üretildiğini" kimse bilmiyor.

 
cosine20 2024-05-16

Gerçekten ilginç bir bakış açısı. Çok faydalı oldu.

 
ng0301 2024-05-16

İlginç bir bakış açısı.
Kore bakış açısıyla, bunu "işi ticarete dökenlere devredilmiş bir topluluk kafe" gibi gören bir tutum ile "nasıl olsa ikincil bir üretim, ne fark eder ki?" hissi arasında görüyorum.
Yine de, SNS'ye yüklediğim fotoğraflarımın ticari olarak kullanılması hissi bana pek hoş gelmiyor.

 
savvykang 2024-05-16

> İnsan gibi bilgiyi kendi içinde analiz ediyor, kendi düşüncesini oluşturup yeniden düzenleyerek ifade ediyor.

LLM'lerin değer yargıları ve düşünceleri olduğunu savunuyor gibisiniz; kastınız gerçekten bu mu? Sonuca etkisi yok gerçi, ama çıkarıma telif hakkı uygulanmaması gerektiğine dair bir gerekçe olarak çok uygun görünmüyor.

 
cosine20 2024-05-16

Her kelimeyi tokenleştirip, embedding bilgisini latent space içine uygun şekilde yerleştirip düzenleme süreci, soyut olarak bakıldığında değer yargıları ve düşüncelere benzetilebilir diye düşünüyorum.

 
halfenif 2024-05-14

Beynin dijitalleştirilmesiyle ilgili olarak.

"Değerli olan beyinler korunacaktır." diyen birinin sözü aklıma geliyor.

 
secret3056 2024-05-14

Acaba SO tarafı gerçekten dürüstçe siler mi? Yoksa sadece Deleted bayrağını mı koyup daha sonra da "teknik bir hata nedeniyle eğitimde kullanıldı" diye mi duyurur?

 
[Bu yorum gizlendi.]
 
savvykang 2024-05-14

> Üstelik en başından beri, Kore ya da Avrupa’nın aksine, ABD’de ‘unutulma hakkı’ tartışması asla sona ermeyecek gibi görünüyor...

Bu konuda arka plan bilgim olmadığı için kısaca arattım; acaba ifade özgürlüğü ile unutulma hakkı birbiriyle çatıştığı için mi? Henüz bir uzlaşma olmadığı için de yasal düzenleme yapılmamış sanırım.

 
jayuloy 2024-05-14

Vay canına, gerçekten böyle de olabiliyormuş.