10 puan yazan GN⁺ 2025-07-17 | 2 yorum | WhatsApp'ta paylaş
  • /r/DataScience subreddit'inde paylaşılan tartışma ve yanıtların özeti
  • Yazar, veri biliminin doğrulama ve değerlendirme olmadan yalnızca “generative AI” adıyla yürütülmesi gerçeğine karşı kuşku duyuyor
  • Gerçekte ChatGPT'nin ürettiği kodla yalnızca basit bir z-score hesaplaması yapıldı ve model performansı değerlendirilmeden dağıtıma ramak kalana kadar ilerlenmişti
  • Toplulukta ortak olarak “çalışıyorsa dağıtıma alalım” şirket kültürü, doğrulama eksikliği, sorumluluktan kaçınma, bilimsel etiğin feda edilmesi eleştiriliyor
  • Farklı uygulamacılar benzer sorunlar yaşadıklarını belirtirken, “sözde bilime” dönüşen gidişat konusunda güçlü kaygılar dile getiriyor
  • Ancak bazıları, hızlı deneylerin ve basit çözümlerin pratik değerinin de anlaşılması gerektiğini savunarak dengeli bir bakış açısını vurguluyor

Data Science Has Become a Pseudo-Science

  • Avrupa'da yüksek lisans ve doktorasını tamamladıktan sonra 10 yıl boyunca sanayi ile akademi arasında gidip gelerek veri bilimi alanında çalışmış
  • Son 2 yılda, “generative AI” adı altında hiçbir doğrulama olmadan sonuç öne sürme eğilimi artıyor
  • Örnek olarak, zaman serisi anomali tespiti amaçlı bir projede, ChatGPT'nin ürettiği kodla yalnızca ortalama farkının z-score'u hesaplanmış ve hiçbir performans metriği olmadan dağıtım konuşulmuş
  • Bu yaklaşım, bilimsel düşünce olmadan bir kara kutuya soru sorup çıktısını aynen izleyen sözde bilim görüntüsü veriyor ve soru sormanın kendisi bile tabu haline geliyor
  • Bu nedenle yeniden akademiye dönmeyi düşünmekte olduğunu ve bu durumun meslektaşları arasında da paylaşılan bir deneyim olup olmadığını sormak için bu gönderiyi yazdığını belirtiyor

Yorum özeti

Başlıca katılım gösteren görüşler

  • “Yeter ki çalışsın, dağıtıma al” anlayışı yaygın (u/Illustrious-Pound266)
  • Doğrulama ve yol haritası olmadan yalnızca AI vurgusu yapıp batan startup örnekleri de var (u/gothicserp3nt)
  • Kasıtlı olmayan önyargı ya da ayrımcılık yeterince incelenmiyor (u/tehMarzipanEmperor)
  • Çoğu şirkette RAG ya da AI abartılı biçimde paketleniyor; doğruluktan çok gösteriş odaklı kullanılıyor (u/castleking, u/flowanvindir)
  • Sektördeki hava “performance theater” gibi (u/Ty4Readin, u/faulerauslaender)
  • Sonuç üretmek uğruna acele dağıtım, dışı parlak raporlar ve ölçümsüz AI kullanımı sıradanlaşıyor (u/glittering_tiger8996, u/Emergency-Job4136)
  • Bu durumun aslında eskiden beri var olduğu, GenAI'nin sadece bunu daha görünür kılan bir araç olduğu görüşü de yaygın (u/RoomyRoots, u/303uru, u/TARehman)
  • Açıklanabilirliği düşük, güvenilirliği de zayıf olsa bile hızlı olduğu için benimseniyor
  • Şirket kararlarında hesap verebilirlik ortadan kalkıyor (u/empathic_psychopath8, u/Jollyhrothgar)

Farklı bakış açıları

  • Basit bir yaklaşım da sorunu çözüyorsa, bunu pratik açıdan kabul etmek gerekir (u/AnarkittenSurprise)
  • Birçok yorumda “DS zaten baştan beri bilim dışı unsurlar da içeriyordu” ya da “adı bilim sadece” görüşü var (u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
  • Önemli olan AI araçlarını kullanmak değil, onları sorumlu biçimde kullanabilme becerisi (u/Dror_sim, u/ResearchMindless6419)
  • Veri var ama mantık yok”, “istatistik bilgisi olmadan sadece paket çalıştırma düzeyi” eleştirileri (u/gyp_casino, u/tmotytmoty)
  • Birçok kişiye göre asıl önemli olan alan bilgisi ve matematiksel düşünme; AI/kodlama ise yalnızca araç (u/MightBeRong, u/Dror_sim)

Kurumsal ve eğitimle ilgili sorunlar

  • MSDS programları akademik olarak yararlı olsa da çoğu zaman istihdamla doğrudan bağlantılı değil (u/throwaway_ghost_122)
  • Eğitim seviyesi düşüyor ve sadece diploma almak isteyen talep arttıkça sahadaki genel kalite geriliyor (u/Yam_Cheap)
  • Akademide de doğrulanmamış makaleler ve yüzeysel analizler artıyor; yani akademi de istisna değil (u/joule_3am, u/Mishtle)

Sektörlere göre deneyim paylaşımı

  • Sigorta ve sağlık gibi alanlarda sıkı düzenlemeler nedeniyle hâlâ geçerlilik incelemesi ve hukuk denetimi gerekiyor (u/Mishtle, u/mikka1)
  • Buna karşılık startup, satış, oyun ve bazı üretim alanlarında hız ve gösteriş ön planda (u/Vercingetorex89, u/Brackens_World)
  • Kamu tarafında da ChatGPT'nin benimsenmesiyle geçmişteki doğrulama mekanizmaları aşınıyor (u/TheFluffyEngineer, u/joule_3am)

Şüphecilik ve çıkış arayışı

  • Sektörü bırakmayı ya da akademiye geçmeyi düşünen çok sayıda uygulamacı var (u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
  • Bazılarıysa bunu gerçekten yetkin kişilerin daha fazla öne çıkabileceği bir fırsat olarak görüyor (u/OddEditor2467, u/sideshowbob01)

Hiciv ve kabulleniş

  • “Bugünlerde sadece pandas import edince bile veri bilimci olunuyor” (u/vesnikos)
  • Olasılıksal düşünme ve bilimsel doğrulamadan çok, yöneticinin keyfine göre hareket etmenin merkezde olduğu bir ortam eleştiriliyor (u/tmotytmoty, u/WignerVille)
  • “Eskiden de böyleydi, şimdi de böyle; DS'ye şirket ortamında bilim demek zaten zordu” diyen gerçekçi yorumlar da çok (u/TaiChuanDoAddct, u/LighterningZ)

Sonuç

  • Bu yazı ve yorumlar, son dönemde veri bilimi pratiğinin bilimsel tutarlılık ve doğrulamadan çok hızlı teslimat ve AI pazarlamasının etkisine girdiğini açık biçimde gösteriyor
  • “Generative AI” etiketinin makul eleştiriyi bastırdığı ve doğrulanmamış kodun doğrudan dağıtıma giden bir yapıya dönüştüğü yönündeki kaygılar derin
  • Akademi de sanayi de kusursuz değil; ancak veri biliminin gerçek anlamda bir “bilim” olabilmesi için topluluk içinde eleştirel düşünceye, eğitime ve çalışma kültürünün sorgulanmasına ihtiyaç olduğu yönündeki tartışma sürecek gibi görünüyor

2 yorum

 
ytuniverse 2025-07-17

Bağlantı çalışmıyor gibi görünüyor
https://reddit.com/r/datascience/…

 
xguru 2025-07-17

Teşekkürler. Düzelttim.