İşyerimizdeki LLM kitlesel hezeyanı
(blog.avas.space)- Mali sıkıntı içindeki bir işyerinde temel iş bütçeleri kesilirken yapay zeka benimsenmesine para akmasının yarattığı çelişkili duruma bizzat tanıklık eden bir deneyim kaydı
- Yıllardır bonuslar iptal edilirken, personel, lisans ve veritabanı kesintiye uğrarken danışmanlar, LLM atölyeleri, ChatGPT ve Copilot lisansları için harcamalar anında onaylandı
- Yüzlerce kişinin katıldığı şirket geneli toplantılarda çeşitli ekipler LLM projelerini denedi ama tek bir tanesi bile başarılı olmadı
- Sunulan genel kullanım örnekleri, bottan ruh halini sormak, 1 sayfalık öğle yemeği menüsünü özetletmek, şüpheli e-postaları ChatGPT'ye yüklemek gibi anlamsız ya da riskli düzeyde kaldı
- Bu durum kontrolden çıkmış bir kitlesel hezeyan olarak tanımlanıyor; liderliğin isterse yapabileceği şeylerin bugüne kadar kasten engellendiğinin ortaya çıktığı bir güven çöküşü anı olarak değerlendiriliyor
Çelişkili mali tablo ve yapay zeka benimsemesinin arka planı
- İşveren kronik bir mali sıkıntı içinde ve boş kalan pozisyonlar doldurulmadan tamamen ortadan kalkıyor
- 2 yıl önce başarılı çalışanlara verilen bonuslar kalıcı olarak iptal edildi
- Zorunlu kaynaklar kesildi ve sadece "bir şekilde idare edin" denildi
- Birçok departman yeni personel alınmadan aşırı iş yükü altında çalışıyor; maliyet düşürmek için kritik lisanslar ve veritabanları kaldırıldı
- Buna rağmen yapay zeka ile ilgili harcamalar istisnai biçimde onaylanıyor
- "Tam gaz" gidilmesini öneren danışmanların işe alınması için bütçe bulundu
- Yıllarca sürecek harici LLM atölyeleri ve seminerleri için bütçe bulundu
- Hem ChatGPT hem Copilot lisansları için bütçe bulundu
- Çalışan bonuslarıyla iş destek fonlarının dolandırıcılara, güvenlik risklerine, işe yaramaz atölyelere ve teknoloji faşistlerine aktarıldığı eleştirisi yapılıyor
Şirket genelindeki LLM projelerinin topyekûn başarısızlığı
- Departmanlar bazında LLM projelerinin kaydedilip pilot olarak çalıştırıldığı, ardından sonuçların sunulduğu tekrarlanan toplantılar yapıldı
- Tüm toplantılara katılınmasına rağmen gerçekten başarılı olmuş tek bir örnek bile yoktu
- Yüzlerce kişi, birçok ekip, yapay zekaya hevesli insanlar ve her türden proje denendi
- Bütün projeler "çalışmıyor", "zaman kazandırmıyor", "aksine işi daha karmaşık hale getiriyor" sonucuna vardı
- Atölyeler, "prompt engineering", özel GPT'ler, ön hazırlık belgeleri ve şablonlarla bile tekrarlanabilir bir etki üretilemedi (yazılım geliştirme alanı değil)
- Her seferinde dağınık bir kumar gibiydi; ince ayar, tekrar deneme, çıktı doğrulama ve hata düzeltmeye ciddi zaman harcandı
- Belirli belgeleri dikkate almama, halüsinasyon, belgeleri doğru dolduramama ya da düzenleyememe en büyük şikayetlerdi
- Enterprise lisansında bile kısıtlar fazla ağırdı
Anlamsız genel kullanım örneklerinin gösterimi
- Belirli projelerden bağımsız, gündelik işler için genel kullanım örneklerinin sunulduğu ayrı toplantılar da vardı
- Bota "Bugün nasıl hissediyorsun?" diye sorma özelliği ciddi ciddi demolandı
- Bu bir şaka ya da hiciv değil; geleceksi ve insani olduğu iddiasıyla sunuldu
- 5 yıl önce binlerce dolarlık bir abonelikle botla anlamsız sohbet etmenin önerilmesi alay konusu olurdu; bu tepkinin hâlâ doğru olduğu vurgulanıyor
- İntranetteki 1 sayfalık yemekhane menüsünü (Excel sayfası) ChatGPT'ye yükleyip "Çarşamba öğle yemeğinde ne var?" diye sorma örneği gösterildi
- Botun yanıtı, sayfanın tamamını okumaktan daha uzundu
- İndirme, yükleme ve prompt yazma süreci, sayfayı doğrudan okumaktan daha uzun sürdü
- Tek bakışta görülebilecek bilgi için bota gerek yoktu
- BT sorumlusu tarafından doğrudan verilen bir örnekte, spam, phishing veya şüpheli ek içeren e-postaların masaüstüne kaydedilip sonra ChatGPT'ye yüklenerek kontrol edilmesi önerildi
- Bunun, teknolojiye aşina olmayan çalışanları şüpheli dosyaları iş dizüstülerine kaydetmeye yönlendiren tehlikeli bir yaklaşım olduğu belirtiliyor
Yapay zekanın büyüttüğü Dunning-Kruger etkisi
- Yapay zekanın insanların Dunning-Kruger etkisini büyüttüğü, böylece denedikleri her şeyin daha akıllıca ve daha meşru görünmesini sağladığı söyleniyor
- Sıradan ve değersiz işler yapılırken bile sanki önemli ve çığır açıcı bir iş yapılıyormuş gibi bir görüntü oluşuyor
- Teknoloji savunucuları kendilerini dev bir devrimin parçası gibi hissediyor ve eleştirmenlerin bir gün özür dileyeceğini hayal ediyor
- Sorumluluk sahibi ve yetkin insanların belirgin bir neden olmadan yapay zeka şirketlerinin tanıtım elemanlarına dönüşmesinden endişe ediliyor
- Nitelikli kişilerin, temizlik ürünlerinin etkisini abartan kapıdan satış görevlileri seviyesine düştüğü söyleniyor
Saf hype ve güven çöküşü
- Çözülecek somut bir sorun olmamasına ve çalışanların en az %90'ının Copilot benzeri araçlardan fayda sağlayacak iş yapmamasına rağmen benimseme dayatılıyor
- Sorun olmayan yerde sorun icat ediliyor; token tüketmek ve aboneliği meşrulaştırmak için tekrar tekrar kullanım senaryoları üretiliyor
- Bunun üst yönetime "En azından denedik" diyebilmek için yapılan göstermelik bir hareket olduğu söyleniyor
- Tüm kullanım, "keşif" ve "oyun" gerekçesiyle meşrulaştırılıyor; zaman kaybı, para kaybı ve perde arkasındaki güçlerin etkisi küçümseniyor
- Yapay zeka benimsemesinin hızı sorgulanıyor
- Sürekli para olmadığını söyleyen bir yerde yüksek başlangıç maliyetli ve istikrarsız bir teknoloji anında onaylandı
- Kamu sektöründe genelde kenarda kalan yeni teknolojiler bu kez tüm ilgiyi topladı
- Değişimi uygulamaya alması yıllar hatta on yıllar süren bir kurum, bir anda yapay zeka altyapısı ve kurumsal yetkinlik kazandı
- Bu durum, kurumdaki yavaş değişimin varsayılan durum değil bilinçli bir tasarım olduğunu ortaya koyan bir "maskenin düştüğü an" olarak anlatılıyor
- Engellerin özsel değil, keyfi birer yalan olduğu açığa çıkmış oldu
- Bu da çalışanlar için güveni tamamen yıkan bir an haline geldi
Bundan sonrası için mesele
- "İlerleme" adına saygı duyulan kurum büyüklerinin kendilerini bu kadar küçük düşürdüğü bir deneyimin nasıl unutulup geçileceğine dair temel bir soru soruluyor
- Aylar boyunca tekrar tekrar gaslighting yaşanıyormuş gibi bir kültür oluştuğu, bunun insanın kendi aklından şüphe etmesine yol açtığı söyleniyor
- Bu deneyimin unutulamayacağı belirtiliyor ve "benim ikinci COVID'im" diye tanımlanıyor
- Son olarak, böyle bir şeyin yaşanmadığı bir işyerinde olanlar adına içtenlikle sevindiğini; yapay zekayı akıllıca kullanıp iyi sonuçlar alan sektörleri ve insanları alkışladığını söylüyor
- Ancak yukarıdaki durumların gerçekten var olduğu için, bu çılgınlık hakkında birlikte konuşabilmek adına yaşanan deneyimin inkâr edilmemesi isteniyor
3 yorum
Sonuç olmasa bile, bir şekilde örgütü ayakta tutma ve hayatta kalma çabası değil mi...
Bu çabanın, "fonların dolandırıcılara, güvenlik risklerine, işe yaramaz atölyelere ve teknoloji faşistlerine aktığına dikkat çekiliyor" diye eleştiri alıyorsa, pek de iyi bir çaba sayılmaz sanırım.
Lobste.rs görüşleri
Benim iş yerim de bu kadar kötü değil ama yön aynı. Yeni işe alımlar ya da zamlar için para yok, ama iş danışmanları, devasa kurumsal COTS yazılım lisansları ve AI abonelikleri için her zaman para var
Biraz alaycılığı bir kenara bıraksak bile, devletten daha az katı kurumlarda da “bir şey satın alma” bütçesini bulmak, “çalışanlara ödeme yapma” bütçesini bulmaktan hâlâ daha kolay olabiliyor
Yazarın anlattığı şey, yönetimin işi yürütme konusunda neredeyse ölümcül düzeyde yetersiz olduğu bir durum
Yazar, daha az yetersiz yönetime sahip yeni bir iş bulmalı. Bu zorsa, hayatta kalmak ve ruh sağlığını korumak için başka önlemler almalı
Bu, FAANG’in ölümcül yetersizlikten muaf olduğu anlamına gelmiyor; daha çok, “Aa, e-postaları ve öğle yemeği menüsünü özetliyor mu?!” havasının düşünülenden çok daha yaygın olduğu anlamına geliyor
Benim deneyimim genel olarak biraz daha olumlu tarafta
Ama havaalanından geçerken yöneticileri hedefleyen AI reklamlarını görünce, evet, dışarıdaki durum gerçekten vahim
LLM kullanımı da bu açıdan çok benzer geliyor. Aracın ne yapabildiğini ve nasıl etkili uygulanacağını anlarsanız gerçekten zaman kazandırıyor, ama tek amaç mümkün olduğunca hızlı kod üretmek olursa içinden çıkılması zor bir keşmekeşe dönüşüyor