Yeni arXiv politikası: halüsinasyon kaynak gösterimleri için 1 yıl kullanım yasağı

(twitter.com/tdietterich)

5 puan yazan GN⁺ 2026-05-15 | 1 yorum | WhatsApp'ta paylaş

arXiv Davranış Kuralları, içerik nasıl üretilmiş olursa olsun bir makalede yazar olarak yer almanın, makalenin tamamından sorumluluk almak anlamına geldiğini belirtir
Üretken yapay zeka araçlarının oluşturduğu uygunsuz dil, intihal içerik, yanlı içerik, hata, kusur, yanlış referanslar ve yanıltıcı içerik bilimsel çalışmalara dahil edilirse sorumluluk yazara aittir
arXiv, bir gönderide yazarın LLM tarafından üretilen çıktıyı doğrulamadığına dair açık kanıt varsa, o makaledeki hiçbir içeriğin güvenilir olmadığı görüşündedir
Yaptırım, arXiv’i 1 yıl kullanma yasağıdır; bunun ardından arXiv’e yeniden gönderim yapabilmek için önce saygın bir hakemli akademik venue tarafından kabul edilmiş olmak gerekir
Açık kanıtlara halüsinasyon referanslar ve LLM’in meta yorumları dahildir
- Örnek: “here is a 200 word summary; would you like me to make any changes?”
- Örnek: “the data in this table is illustrative, fill it in with the real numbers from your experiments”

1 yorum

GN⁺ 2026-05-15

Hacker News görüşleri

Cezanın arXiv'i 1 yıl kullanma yasağından sonra, sonraki gönderilerin önce itibarlı bir hakemli yayıncı tarafından kabul edilmiş olması şartını da içermesi, bilim için gerçekten çok iyi olurdu
arXiv ücretsiz olsa da bir haktan çok bir ayrıcalık gibi
Yine de bu durum https://info.arxiv.org/help/policies/index.html sayfasında açıkça görünmüyor; belki hâlâ plan aşamasındadır ya da ben yeterince iyi bakmamışımdır
Bir doktoranın dediği gibi, kıyamet makinesinin asıl meselesi, onu gizli tutarsanız hiçbir anlamının olmamasıdır
- Bu gönderi yayımlandıktan sonra birilerinin çoktan kabaca bir kaynakça denetleyicisi yapıp bunu abonelik modeliyle satmayı düşünmeye başlamış olduğuna eminim
  Kaynakça kontrolü için iyi olabilir ama beraberinde gelen berbat bilimin kendisini pek azaltmaz gibi duruyor
- Bence bu aşırı görünüyor
  arXiv gönderileri o kadar yakından incelemiyorken bunu nasıl bilebilir?
  “Hata, yanlışlık” deniyor ama yapılan şey esas olarak temel koşulların otomatik sistemle kontrol edilip bazen yüzeysel bir insan incelemesine geçilmesi; tüm kaynakçaları büyük ölçekte doğrulamak mümkün değil
  Hakemli dergilerden 100 kat daha fazla hacim alan bir ön baskı arşivinde hakemlik benzeri bir süreç kurmaya çalışmış oluyorsunuz
  Ayrıca arXiv'e yüklemekle hakem değerlendirmesinden geçmek arasında muazzam fark var
  Ben de kişisel olarak matematik alanında muhtemelen ondan fazla hakemli ret aldım ama arXiv math'e sorunsuz yükledim
  Hakemlik sadece yeni ve doğru olup olmadığına bakmıyor, aynı zamanda “matematik topluluğu için ilginç mi” diye de bakıyor; bu özünde öznel ve arXiv'e kabulden çok daha zor
  Sayılar teorisinde tanınmış bir profesör kefalet sürecinde makaleyi övdü, başka bir profesör de e-postayla yayımlanmasını önerdi ama yine de 3 kez reddedildi ve hâlâ bekliyorum
  Hakemli dergide yayımlanma şartı koymak, birçok araştırmacı için arXiv'i sonsuza kadar kapatabilir ve ön baskı fikrine de aykırı olur
- Bunun “bilim için gerçekten iyi” olduğuna katılmıyorum
  Sonuçta sadece uydurulmuş bir alıntı var, dolandırıcılık falan değil
  Bu, kişinin araştırmasının içeriği ya da kalitesi hakkında hiçbir şey söylemiyor
  Böyle küçük bir ilk hata için 1 yıllık yasak zaten yeterli görünüyor
  İnsanlar hata yapar ve önemli bir kısmı bu hatalardan ders çıkarabilir
  Hayatında bir kez yapay zekanın bir kaynakçayı uydurması yüzünden birinin kariyer ilerlemesini ya da insanlığa katkı sunma kapasitesini kalıcı olarak mahvetmeye gerek yok
  Bu, onarıcı olmaktan çok cezalandırıcı
Hoş karşılanacak bir adım ama daha temelde, atıf yapılan makaleler için doğru BibTeX girdisi üretmeyi kolaylaştırma sorununun çözülmesini daha çok isterdim
Belirli bir makalenin atıf bilgileri yayınevi dergileri, konferanslar, ön baskılar gibi birçok farklı kaynaktan gelebiliyor
Aynı makale arXiv ve konferans sitesi gibi birden fazla yerde bulunabiliyor ve ayrıntılar az da olsa farklı olabiliyor
Zotero gibi araçlar sayesinde yayımlanmış web sayfalarından atıf çekmek çok daha kolaylaştı ama çıkarılan BibTeX ayrıntılarında hâlâ sorunlar var
Yazar adları ve başlık genelde doğru geliyor ama yayınevi, yıl, cilt/sayı, sayfa, URL gibi bilgilerin doğru çekilip çekilmediğini ve LaTeX biçiminde düzgün görünüp görünmediğini hâlâ elle kontrol etmek gerekiyor
Ayrıca her yayının atıf stili de farklı olabiliyor
Tutarlı atıf verisini kolayca çekmeye yarayan birleşik bir yöntem olmayınca, ne yazık ki yapay zeka üretimli atıf verisine kestirmeden gitme eğilimi doğabiliyor
Uydurma atıfların ana metinde mi yoksa ayrı bir BibTeX dosyasında mı üretildiğinden emin değilim; dolayısıyla meseleyi biraz yanlış anlamış olabilirim
- Zotero'nun, URL/DOI/ISBN vb. bilgilerden istenen biçimde atıf ya da BibTeX dosyası oluşturan ücretsiz bir çevrimiçi aracı da var
  https://zbib.org/
https://xcancel.com/tdietterich/status/2055000956144935055
- Davranış kurallarına göre bir makalede yazar olarak adının geçmesi, içerik nasıl üretilmiş olursa olsun, her yazarın o içeriğin tamamı için tam sorumluluk taşıdığı anlamına geliyor
Sorun, uydurulmuş kaynakçaları büyük ölçekte nasıl tespit edecekleri
Elle örnekleme mi yapılacak, otomatik DOI doğrulaması mı olacak bilmiyorum
Politikanın yönü doğru görünüyor ama uygulaması zor
Güzel
LLM çıktısını dikkatlice kontrol edecek vaktin yoksa, benim de onu okuyacak vaktim yok
- Ne yazık ki LLM ile üretilip üretilmediğinden bağımsız olarak arXiv makalelerinin %99'u muhtemelen okumaya değmez
  Rastgele bir tane seçip gerçekten derinlemesine baktığın oldu mu?
Burada hâlâ “itibarlı” şartının ne anlama geldiğine dair bir şey göremiyorum
İtibarlı hakemlik hangi ölçüte göre belirlenecek?
Böyle yaptırımlar gelmeden önce dikkatli doğrulama şart
Birisi açık izin almadan birinin adını yazıp gönderim yaptıysa herkes mi yasaklanacak?
Düzgün uygulanırsa bunun iyi bir yönelim olduğuna katılıyorum
- Üstelik bildiğim kadarıyla doğrulama olmadan istediğin ortak yazarı ekleyebiliyorsun
  O zaman tek cümlelik bir makaleyle arXiv'deki herkesi yasaklatmak bile mümkün olabilir
Twitter'da hep görülen LLM konusunda aşırı heyecanlı destekçilerin bu önleme öfkelenip yanıtlar yazması oldukça açıklayıcı bir işaret
LLM kirliliğiyle ilgili gönderilerin yorumlarında olduğu gibi, bazı insanlar LLM'den hoşlanmayanların varlığını kabul edemiyor ve hızlı benimsenmenin önüne en küçük bir engel çıkınca sinirleniyor
- Bunun griye düşürülmüş olması tuhaf
  Sonunda HN'nin uzlaşısı, her yerde LLM kullanımını ateşli biçimde hızlandırmak mı oluyor diye düşündürüyor
  Saçma ama aynı zamanda tam da HN'lik
Güzel. Akademik literatür her tür düşük kaliteli çöp yüzünden zaten kriz içinde
Kolayca tespit edilebilen uydurma içerikler için hesap sorulması ancak iyi olabilir
- Bu sadece AI'a özgü bir sorun değil
  Yaklaşık 40 yıl önce fizik doktorası yapıyordum; o zaman da yanlış kaynakçalar sorundu
Bir meslektaşım, ana metinde kelimesi kelimesine AI çöpü cümleler bırakılmış hâlde makale gönderdi ve çok sert düzeltme talepleri aldı
Göndermeden önce taslağı kontrol etmek gerekir
Hakemler bunu yakalıyor
- LaTeX yorumlarını da kontrol etmek gerekir. arXiv bunları herkese açık hâle getiriyor
  Ben ekran okuyucu kullandığım için makaleleri genelde ham TeX olarak okuyorum ve her şeyi gördüm
  Aşağılayıcı ifadeler, hakemlere ve profesörlere hakaretler, dolandırıcılık itirafları, hatta önceki dolandırıcılıkları örtmek için gönderimden önce ortak yazarlara ek dolandırıcılık talimatları bile var
  Düşünüldüğünden çok daha az; makalelerin %1'inden azı ama gerçekten var
  Yeni arXiv makalelerinin TeX kaynaklarında bir kez LLM tabanlı dolandırıcılık tespiti çalıştırmak faydalı olabilir
  Hepsini yakalamaz ama en aptal dolandırıcıların bir kısmını yakalayabilir
  Bunun olumlu bir yanı da var: hakemden geçememiş daha güçlü iddiaları, konferans sayfa sınırı yüzünden çıkarılmış ek açıklamaları ve yazarların eklemeye değmez gördüğü deney sonuçlarını da bulabiliyorsunuz
  Bunlara çok dikkatli yaklaşmak gerekir ama bazen gerçekten faydalı olabiliyor
- Buradaki öneri, en baştan çöp göndermemek değil de çöpü, hakemlerin fark etmesini zorlaştıracak şekilde kamufle etmekmiş gibi geliyor; bu da üzücü

Yeni arXiv politikası: halüsinasyon kaynak gösterimleri için 1 yıl kullanım yasağı

İlgili okumalar

1 yorum

Hacker News görüşleri