- /r/DataScience subreddit'inde paylaşılan tartışma ve yanıtların özeti
- Yazar, veri biliminin doğrulama ve değerlendirme olmadan yalnızca “generative AI” adıyla yürütülmesi gerçeğine karşı kuşku duyuyor
- Gerçekte ChatGPT'nin ürettiği kodla yalnızca basit bir z-score hesaplaması yapıldı ve model performansı değerlendirilmeden dağıtıma ramak kalana kadar ilerlenmişti
- Toplulukta ortak olarak “çalışıyorsa dağıtıma alalım” şirket kültürü, doğrulama eksikliği, sorumluluktan kaçınma, bilimsel etiğin feda edilmesi eleştiriliyor
- Farklı uygulamacılar benzer sorunlar yaşadıklarını belirtirken, “sözde bilime” dönüşen gidişat konusunda güçlü kaygılar dile getiriyor
- Ancak bazıları, hızlı deneylerin ve basit çözümlerin pratik değerinin de anlaşılması gerektiğini savunarak dengeli bir bakış açısını vurguluyor
Data Science Has Become a Pseudo-Science
- Avrupa'da yüksek lisans ve doktorasını tamamladıktan sonra 10 yıl boyunca sanayi ile akademi arasında gidip gelerek veri bilimi alanında çalışmış
- Son 2 yılda, “generative AI” adı altında hiçbir doğrulama olmadan sonuç öne sürme eğilimi artıyor
- Örnek olarak, zaman serisi anomali tespiti amaçlı bir projede, ChatGPT'nin ürettiği kodla yalnızca ortalama farkının z-score'u hesaplanmış ve hiçbir performans metriği olmadan dağıtım konuşulmuş
- Bu yaklaşım, bilimsel düşünce olmadan bir kara kutuya soru sorup çıktısını aynen izleyen sözde bilim görüntüsü veriyor ve soru sormanın kendisi bile tabu haline geliyor
- Bu nedenle yeniden akademiye dönmeyi düşünmekte olduğunu ve bu durumun meslektaşları arasında da paylaşılan bir deneyim olup olmadığını sormak için bu gönderiyi yazdığını belirtiyor
Yorum özeti
Başlıca katılım gösteren görüşler
- “Yeter ki çalışsın, dağıtıma al” anlayışı yaygın (
u/Illustrious-Pound266)
- Doğrulama ve yol haritası olmadan yalnızca AI vurgusu yapıp batan startup örnekleri de var (
u/gothicserp3nt)
- Kasıtlı olmayan önyargı ya da ayrımcılık yeterince incelenmiyor (
u/tehMarzipanEmperor)
- Çoğu şirkette RAG ya da AI abartılı biçimde paketleniyor; doğruluktan çok gösteriş odaklı kullanılıyor (
u/castleking, u/flowanvindir)
- Sektördeki hava “performance theater” gibi (
u/Ty4Readin, u/faulerauslaender)
- Sonuç üretmek uğruna acele dağıtım, dışı parlak raporlar ve ölçümsüz AI kullanımı sıradanlaşıyor (
u/glittering_tiger8996, u/Emergency-Job4136)
- Bu durumun aslında eskiden beri var olduğu, GenAI'nin sadece bunu daha görünür kılan bir araç olduğu görüşü de yaygın (
u/RoomyRoots, u/303uru, u/TARehman)
- Açıklanabilirliği düşük, güvenilirliği de zayıf olsa bile hızlı olduğu için benimseniyor
- Şirket kararlarında hesap verebilirlik ortadan kalkıyor (
u/empathic_psychopath8, u/Jollyhrothgar)
Farklı bakış açıları
- Basit bir yaklaşım da sorunu çözüyorsa, bunu pratik açıdan kabul etmek gerekir (
u/AnarkittenSurprise)
- Birçok yorumda “DS zaten baştan beri bilim dışı unsurlar da içeriyordu” ya da “adı bilim sadece” görüşü var (
u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
- Önemli olan AI araçlarını kullanmak değil, onları sorumlu biçimde kullanabilme becerisi (
u/Dror_sim, u/ResearchMindless6419)
- “Veri var ama mantık yok”, “istatistik bilgisi olmadan sadece paket çalıştırma düzeyi” eleştirileri (
u/gyp_casino, u/tmotytmoty)
- Birçok kişiye göre asıl önemli olan alan bilgisi ve matematiksel düşünme; AI/kodlama ise yalnızca araç (
u/MightBeRong, u/Dror_sim)
Kurumsal ve eğitimle ilgili sorunlar
- MSDS programları akademik olarak yararlı olsa da çoğu zaman istihdamla doğrudan bağlantılı değil (
u/throwaway_ghost_122)
- Eğitim seviyesi düşüyor ve sadece diploma almak isteyen talep arttıkça sahadaki genel kalite geriliyor (
u/Yam_Cheap)
- Akademide de doğrulanmamış makaleler ve yüzeysel analizler artıyor; yani akademi de istisna değil (
u/joule_3am, u/Mishtle)
Sektörlere göre deneyim paylaşımı
- Sigorta ve sağlık gibi alanlarda sıkı düzenlemeler nedeniyle hâlâ geçerlilik incelemesi ve hukuk denetimi gerekiyor (
u/Mishtle, u/mikka1)
- Buna karşılık startup, satış, oyun ve bazı üretim alanlarında hız ve gösteriş ön planda (
u/Vercingetorex89, u/Brackens_World)
- Kamu tarafında da ChatGPT'nin benimsenmesiyle geçmişteki doğrulama mekanizmaları aşınıyor (
u/TheFluffyEngineer, u/joule_3am)
Şüphecilik ve çıkış arayışı
- Sektörü bırakmayı ya da akademiye geçmeyi düşünen çok sayıda uygulamacı var (
u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
- Bazılarıysa bunu gerçekten yetkin kişilerin daha fazla öne çıkabileceği bir fırsat olarak görüyor (
u/OddEditor2467, u/sideshowbob01)
Hiciv ve kabulleniş
- “Bugünlerde sadece pandas import edince bile veri bilimci olunuyor” (
u/vesnikos)
- Olasılıksal düşünme ve bilimsel doğrulamadan çok, yöneticinin keyfine göre hareket etmenin merkezde olduğu bir ortam eleştiriliyor (
u/tmotytmoty, u/WignerVille)
- “Eskiden de böyleydi, şimdi de böyle; DS'ye şirket ortamında bilim demek zaten zordu” diyen gerçekçi yorumlar da çok (
u/TaiChuanDoAddct, u/LighterningZ)
Sonuç
- Bu yazı ve yorumlar, son dönemde veri bilimi pratiğinin bilimsel tutarlılık ve doğrulamadan çok hızlı teslimat ve AI pazarlamasının etkisine girdiğini açık biçimde gösteriyor
- “Generative AI” etiketinin makul eleştiriyi bastırdığı ve doğrulanmamış kodun doğrudan dağıtıma giden bir yapıya dönüştüğü yönündeki kaygılar derin
- Akademi de sanayi de kusursuz değil; ancak veri biliminin gerçek anlamda bir “bilim” olabilmesi için topluluk içinde eleştirel düşünceye, eğitime ve çalışma kültürünün sorgulanmasına ihtiyaç olduğu yönündeki tartışma sürecek gibi görünüyor
2 yorum
Bağlantı çalışmıyor gibi görünüyor
https://reddit.com/r/datascience/…
Teşekkürler. Düzelttim.