6 puan yazan GN⁺ 4 시간 전 | 3 yorum | WhatsApp'ta paylaş
  • Mali sıkıntı içindeki bir işyerinde temel iş bütçeleri kesilirken yapay zeka benimsenmesine para akmasının yarattığı çelişkili duruma bizzat tanıklık eden bir deneyim kaydı
  • Yıllardır bonuslar iptal edilirken, personel, lisans ve veritabanı kesintiye uğrarken danışmanlar, LLM atölyeleri, ChatGPT ve Copilot lisansları için harcamalar anında onaylandı
  • Yüzlerce kişinin katıldığı şirket geneli toplantılarda çeşitli ekipler LLM projelerini denedi ama tek bir tanesi bile başarılı olmadı
  • Sunulan genel kullanım örnekleri, bottan ruh halini sormak, 1 sayfalık öğle yemeği menüsünü özetletmek, şüpheli e-postaları ChatGPT'ye yüklemek gibi anlamsız ya da riskli düzeyde kaldı
  • Bu durum kontrolden çıkmış bir kitlesel hezeyan olarak tanımlanıyor; liderliğin isterse yapabileceği şeylerin bugüne kadar kasten engellendiğinin ortaya çıktığı bir güven çöküşü anı olarak değerlendiriliyor

Çelişkili mali tablo ve yapay zeka benimsemesinin arka planı

  • İşveren kronik bir mali sıkıntı içinde ve boş kalan pozisyonlar doldurulmadan tamamen ortadan kalkıyor
    • 2 yıl önce başarılı çalışanlara verilen bonuslar kalıcı olarak iptal edildi
    • Zorunlu kaynaklar kesildi ve sadece "bir şekilde idare edin" denildi
    • Birçok departman yeni personel alınmadan aşırı iş yükü altında çalışıyor; maliyet düşürmek için kritik lisanslar ve veritabanları kaldırıldı
  • Buna rağmen yapay zeka ile ilgili harcamalar istisnai biçimde onaylanıyor
    • "Tam gaz" gidilmesini öneren danışmanların işe alınması için bütçe bulundu
    • Yıllarca sürecek harici LLM atölyeleri ve seminerleri için bütçe bulundu
    • Hem ChatGPT hem Copilot lisansları için bütçe bulundu
  • Çalışan bonuslarıyla iş destek fonlarının dolandırıcılara, güvenlik risklerine, işe yaramaz atölyelere ve teknoloji faşistlerine aktarıldığı eleştirisi yapılıyor

Şirket genelindeki LLM projelerinin topyekûn başarısızlığı

  • Departmanlar bazında LLM projelerinin kaydedilip pilot olarak çalıştırıldığı, ardından sonuçların sunulduğu tekrarlanan toplantılar yapıldı
  • Tüm toplantılara katılınmasına rağmen gerçekten başarılı olmuş tek bir örnek bile yoktu
    • Yüzlerce kişi, birçok ekip, yapay zekaya hevesli insanlar ve her türden proje denendi
    • Bütün projeler "çalışmıyor", "zaman kazandırmıyor", "aksine işi daha karmaşık hale getiriyor" sonucuna vardı
  • Atölyeler, "prompt engineering", özel GPT'ler, ön hazırlık belgeleri ve şablonlarla bile tekrarlanabilir bir etki üretilemedi (yazılım geliştirme alanı değil)
    • Her seferinde dağınık bir kumar gibiydi; ince ayar, tekrar deneme, çıktı doğrulama ve hata düzeltmeye ciddi zaman harcandı
    • Belirli belgeleri dikkate almama, halüsinasyon, belgeleri doğru dolduramama ya da düzenleyememe en büyük şikayetlerdi
    • Enterprise lisansında bile kısıtlar fazla ağırdı

Anlamsız genel kullanım örneklerinin gösterimi

  • Belirli projelerden bağımsız, gündelik işler için genel kullanım örneklerinin sunulduğu ayrı toplantılar da vardı
  • Bota "Bugün nasıl hissediyorsun?" diye sorma özelliği ciddi ciddi demolandı
    • Bu bir şaka ya da hiciv değil; geleceksi ve insani olduğu iddiasıyla sunuldu
    • 5 yıl önce binlerce dolarlık bir abonelikle botla anlamsız sohbet etmenin önerilmesi alay konusu olurdu; bu tepkinin hâlâ doğru olduğu vurgulanıyor
  • İntranetteki 1 sayfalık yemekhane menüsünü (Excel sayfası) ChatGPT'ye yükleyip "Çarşamba öğle yemeğinde ne var?" diye sorma örneği gösterildi
    • Botun yanıtı, sayfanın tamamını okumaktan daha uzundu
    • İndirme, yükleme ve prompt yazma süreci, sayfayı doğrudan okumaktan daha uzun sürdü
    • Tek bakışta görülebilecek bilgi için bota gerek yoktu
  • BT sorumlusu tarafından doğrudan verilen bir örnekte, spam, phishing veya şüpheli ek içeren e-postaların masaüstüne kaydedilip sonra ChatGPT'ye yüklenerek kontrol edilmesi önerildi
    • Bunun, teknolojiye aşina olmayan çalışanları şüpheli dosyaları iş dizüstülerine kaydetmeye yönlendiren tehlikeli bir yaklaşım olduğu belirtiliyor

Yapay zekanın büyüttüğü Dunning-Kruger etkisi

  • Yapay zekanın insanların Dunning-Kruger etkisini büyüttüğü, böylece denedikleri her şeyin daha akıllıca ve daha meşru görünmesini sağladığı söyleniyor
    • Sıradan ve değersiz işler yapılırken bile sanki önemli ve çığır açıcı bir iş yapılıyormuş gibi bir görüntü oluşuyor
    • Teknoloji savunucuları kendilerini dev bir devrimin parçası gibi hissediyor ve eleştirmenlerin bir gün özür dileyeceğini hayal ediyor
  • Sorumluluk sahibi ve yetkin insanların belirgin bir neden olmadan yapay zeka şirketlerinin tanıtım elemanlarına dönüşmesinden endişe ediliyor
    • Nitelikli kişilerin, temizlik ürünlerinin etkisini abartan kapıdan satış görevlileri seviyesine düştüğü söyleniyor

Saf hype ve güven çöküşü

  • Çözülecek somut bir sorun olmamasına ve çalışanların en az %90'ının Copilot benzeri araçlardan fayda sağlayacak iş yapmamasına rağmen benimseme dayatılıyor
    • Sorun olmayan yerde sorun icat ediliyor; token tüketmek ve aboneliği meşrulaştırmak için tekrar tekrar kullanım senaryoları üretiliyor
    • Bunun üst yönetime "En azından denedik" diyebilmek için yapılan göstermelik bir hareket olduğu söyleniyor
  • Tüm kullanım, "keşif" ve "oyun" gerekçesiyle meşrulaştırılıyor; zaman kaybı, para kaybı ve perde arkasındaki güçlerin etkisi küçümseniyor
  • Yapay zeka benimsemesinin hızı sorgulanıyor
    • Sürekli para olmadığını söyleyen bir yerde yüksek başlangıç maliyetli ve istikrarsız bir teknoloji anında onaylandı
    • Kamu sektöründe genelde kenarda kalan yeni teknolojiler bu kez tüm ilgiyi topladı
    • Değişimi uygulamaya alması yıllar hatta on yıllar süren bir kurum, bir anda yapay zeka altyapısı ve kurumsal yetkinlik kazandı
  • Bu durum, kurumdaki yavaş değişimin varsayılan durum değil bilinçli bir tasarım olduğunu ortaya koyan bir "maskenin düştüğü an" olarak anlatılıyor
    • Engellerin özsel değil, keyfi birer yalan olduğu açığa çıkmış oldu
    • Bu da çalışanlar için güveni tamamen yıkan bir an haline geldi

Bundan sonrası için mesele

  • "İlerleme" adına saygı duyulan kurum büyüklerinin kendilerini bu kadar küçük düşürdüğü bir deneyimin nasıl unutulup geçileceğine dair temel bir soru soruluyor
  • Aylar boyunca tekrar tekrar gaslighting yaşanıyormuş gibi bir kültür oluştuğu, bunun insanın kendi aklından şüphe etmesine yol açtığı söyleniyor
  • Bu deneyimin unutulamayacağı belirtiliyor ve "benim ikinci COVID'im" diye tanımlanıyor
  • Son olarak, böyle bir şeyin yaşanmadığı bir işyerinde olanlar adına içtenlikle sevindiğini; yapay zekayı akıllıca kullanıp iyi sonuçlar alan sektörleri ve insanları alkışladığını söylüyor
    • Ancak yukarıdaki durumların gerçekten var olduğu için, bu çılgınlık hakkında birlikte konuşabilmek adına yaşanan deneyimin inkâr edilmemesi isteniyor

3 yorum

 
cnaa97 3 시간 전

Sonuç olmasa bile, bir şekilde örgütü ayakta tutma ve hayatta kalma çabası değil mi...

 
brilliant08 28 분 전

Bu çabanın, "fonların dolandırıcılara, güvenlik risklerine, işe yaramaz atölyelere ve teknoloji faşistlerine aktığına dikkat çekiliyor" diye eleştiri alıyorsa, pek de iyi bir çaba sayılmaz sanırım.

 
GN⁺ 4 시간 전
Lobste.rs görüşleri
  • Benim iş yerim de bu kadar kötü değil ama yön aynı. Yeni işe alımlar ya da zamlar için para yok, ama iş danışmanları, devasa kurumsal COTS yazılım lisansları ve AI abonelikleri için her zaman para var

    • ABD merkezli bir devlet kurumunda çalışıyor gibi görünüyor. Devlet dışında COTS ifadesi çok sık kullanılmaz
      Biraz alaycılığı bir kenara bıraksak bile, devletten daha az katı kurumlarda da “bir şey satın alma” bütçesini bulmak, “çalışanlara ödeme yapma” bütçesini bulmaktan hâlâ daha kolay olabiliyor
  • Yazarın anlattığı şey, yönetimin işi yürütme konusunda neredeyse ölümcül düzeyde yetersiz olduğu bir durum
    Yazar, daha az yetersiz yönetime sahip yeni bir iş bulmalı. Bu zorsa, hayatta kalmak ve ruh sağlığını korumak için başka önlemler almalı

    • Birkaç ay önce FAANG’deki arkadaşlarımdan da oldukça benzer şeyler duydum. O zamanlar tokenmaxxing politika hâline gelmişti
      Bu, FAANG’in ölümcül yetersizlikten muaf olduğu anlamına gelmiyor; daha çok, “Aa, e-postaları ve öğle yemeği menüsünü özetliyor mu?!” havasının düşünülenden çok daha yaygın olduğu anlamına geliyor
  • Benim deneyimim genel olarak biraz daha olumlu tarafta

    1. Sorumsuzca kullanılırsa kodlama ajanları kod tabanını mahvediyor. Küçük tek seferlik prototiplerde ya da tam çöp sayılabilecek SaaS’lerin yerine geçerken idare eder, ama ciddi sistemlere uygun değil. Claude Fable ise sadece çok daha büyük bir karmaşa yaratıyor
    2. Sorumlu kullanmak için öz disiplin ve uygun insanlar gerekiyor; bu durumda kodlama ajanları faydalı olabilir. Darboğaz hâlâ çoğunlukla insanların kodu anlaması ve paydaşlarla aynı seviyede buluşması, yani insanların düşündüğü kadar dönüştürücü değil. Yine de hepsi birden ortadan kalksa biraz eksikliğini hissederdim. Çünkü garip bir vendor API’sine karşı taslak test kodunu elle yazmak istemiyorum
    3. Belge veri madenciliği işlerinin önemli bir kısmında, hata oranı kabul edilebiliyorsa ucuz ve büyük ölçekli çalıştırılabilen LLM’lerin avantajını kesinlikle görüyorum
    4. Yöneticiler makul ölçüde ucuz ve iyi çalışan AI kullanım örneklerini seviyor
      Ama havaalanından geçerken yöneticileri hedefleyen AI reklamlarını görünce, evet, dışarıdaki durum gerçekten vahim
    • Bir bakıma statik tip vs dinamik tip tartışmasını hatırlatıyor. Uygun bir ekip ve yeterli deneyim varsa Clojure gibi bir dille de çok üretken olunabilir, ama insanlar dili suistimal edip akıllılık taslamaya başlayınca bakım yapılamaz korkunç bir karmaşaya dönüşebiliyor
      LLM kullanımı da bu açıdan çok benzer geliyor. Aracın ne yapabildiğini ve nasıl etkili uygulanacağını anlarsanız gerçekten zaman kazandırıyor, ama tek amaç mümkün olduğunca hızlı kod üretmek olursa içinden çıkılması zor bir keşmekeşe dönüşüyor