Amazon çalışanları, AI kullanım baskısı nedeniyle gereksiz işler üretip AI token tüketimini şişiriyor
(fastcompany.com)- Amazon, çalışanların AI token tüketimini takip ederken bazı çalışanlar dahili AI aracı MeshClaw ile gereksiz AI ajanları oluşturarak kullanımı yapay biçimde artırıyor
- Çalışanlar, AI token tüketiminin izlenmesinin kalite yerine kullanımı öne çıkaran bir ortam yarattığını ve bunun da ters teşvik yapısı doğurduğunu düşünüyor
- Amazon tarafı şirket genelinde bir AI kullanım metriği ya da dahili liderlik tablosu bulunduğunu reddetti, ancak çalışanlar haftalık geliştiricilerin %80’inin AI kullanması hedefi ve token tüketimi liderlik tablosu olduğunu öne sürüyor
- MeshClaw, OpenClaw’dan ilham alan bir araç; kullanıcının yerel donanımında bağımsız olarak çalışıyor ve yüksek özerkliğe sahip
- AI benimsemesini nicel metriklerle zorlamanın, gerçek üretkenlik artışı olmadan yalnızca kaynak israfına yol açan yapısal bir sorunu ortaya koyduğu bir örnek
AI kullanım baskısı ve MeshClaw kullanımı
- Amazon çalışanları iş akışlarına daha fazla AI dahil etmeleri yönünde baskı görüyor, ancak tam olarak ne için kullanmaları gerektiği net olmadığı için AI kaynaklarının gereksiz işlerde harcanma ihtimali artıyor
- Financial Times haberine göre bazı Amazon çalışanları, dahili AI aracı MeshClaw’ı üretkenliği artırmaktan çok AI faaliyet hacmini büyüten gereksiz AI ajanları oluşturmak için kullanıyor
- Bir çalışan, “Bu araçları kullanmamız yönünde çok büyük baskı var” diyerek bazılarının token kullanımını en üst düzeye çıkarmak için MeshClaw kullandığını söyledi
Kullanım metrikleri etrafındaki çelişki
- Çalışanlar, Amazon’un AI token tüketimini takip etmesiyle birlikte bazı iş arkadaşlarının teknoloji kullanımında kalite yerine niceliğe öncelik vermeye başladığını düşünüyor
- İsmi verilmeyen birden fazla Amazon çalışanı, AI kullanım beklentileri arttıkça çalışma ortamının kötüleştiğini düşünüyor
- Amazon’un çalışanlara AI kullanım istatistiklerinin performans değerlendirmelerine yansımadığını bildirdiği anlaşılıyor, ancak tüm çalışanlar buna inanmıyor
- Başka bir çalışan, kullanım takibinin çarpık ters teşvikler (perverse incentives) yarattığını ve bazı çalışanları aşırı rekabetçi davranmaya ittiğini düşünüyor
- Röportaj verilen çalışanlar, şirketin her hafta geliştiricilerin %80’inin AI kullanmasını hedeflediğini ve çalışanların token tüketiminin dahili bir liderlik tablosunda takip edildiğini söylüyor
- Amazon sözcüsü, AI kullanımı için şirket genelinde bir metrik olmadığını ve çalışanların birbirleriyle karşılaştırıldığı dahili bir liderlik tablosu da bulunmadığını belirtti
- Bunun yerine çalışanların kişisel panolarında kendi AI kullanım miktarlarını görebildiği bir yapı olduğunu açıkladı
OpenClaw ve yerelde çalıştırmanın riskleri
- Bazı Amazon çalışanlarının AI kullanımını şişirmek için kullandığı MeshClaw, başka bir AI aracı olan OpenClaw’dan ilham alan bir araç
- OpenClaw ve MeshClaw, diğer AI modellerinden farklı olarak kullanıcının kendi donanımında yerel olarak çalışıyor ve bu nedenle yüksek bağımsızlığa sahip
- Bu yılın başında Meta Superintelligence Labs’in alignment direktörü, OpenClaw’un neredeyse e-posta gelen kutusunun tamamını silmesine yol açan olayla gündeme gelmişti; bu da AI’a aşırı erişim yetkisi verildiğinde ortaya çıkan riskleri gösterdi
4 yorum
Eskiden geliştiricilerin geliştirme becerisi göstergesi olarak kaç satır kod yazdıkları ölçülürdü ya hahaha
Gereksiz yere tek seferde yüz binlerce satır yazıp ortaya topu topu bir iki özellik çıkaran çöp kodlar ortalıkta dolaşırdı
Benzer şekilde performansın sadece çalışma süresiyle ölçülmesi de aklıma geliyor lol
Ortada bir çıktı olmasa bile sadece çok fazla mesai yapınca yüksek değerlendirme alınan durum hehe
Aşırı verimliliğin yan etkileri (2022)
Rastgele seçim, istikrarlı bir meritokrasi sistemi kurmak için gereklidir
Hacker News yorumları
Sadece Amazon değil, büyük teknoloji şirketlerinin genelinde ve bazı küçük şirketlerde de aynı anda topluca çıldırılıyormuş gibi hissettiriyor
Bir CEO’nun bir gün çıkıp “Seyahat masrafı harcamalarını teşvik etmemiz gerekiyor, o yüzden mümkün olduğunca çok iş seyahati ayarlayın ve olabildiğince para harcayın. Uydu ofise giderken birinci sınıfta uçun, Uber yerine limuzin kullanın, lüks restoranlarda yiyin. Yeterince seyahat masrafı yapmazsanız performans değerlendirmesinde düşük not alırsınız” demesine benziyor
Şu an tamamen anormal bir çağdayız
Amazon başkan yardımcısı olsam satın alma tekliflerini de değerlendirirdim; ek özelliklere sahip bir enterprise sürümü üzerinde de çalışılıyor
Show HN: https://news.ycombinator.com/item?id=48151287
Azarlanacağını sanmış ama tam tersine takdir edilmiş, hatta başarısının nasıl olduğunu diğer çalışanlarla paylaşması için kısa bir sunum yapması istenmiş
Artık altyapı harcamalarının %20’si token, geliştirici başına haftalık pull request sayısı da 4,2’den 5,1’e çıktı
Bunların önemli bir kısmı ajanın bir iki satır config dosyası değiştirmesinden ibaret, o yüzden her şey büyülü düşünce gibi görünüyor
Başka uçuşlarda birinci sınıf daha ucuza mümkün olsa bile şirket politikası gereği birinci sınıfta uçamıyordu
Biz hep anormal zamanlarda yaşadık
Bu olmayınca da çalışanların o büyülü AI’ı yeterince sık kullanmadığını varsayıyor gibiler
Kendi AI ürünlerini yapan şirketler, çalışanların AI’ı olabildiğince çok kullanmasını isteyip sonunda çalışanların çoğunu ya da tamamını değiştirecek eğitim verisini elde etmeyi amaçlıyor da olabilir
Kendi AI ikamelerini eğitmeyi reddeden çalışanları cezalandırmak, bugün maliyetli olsa bile ilerideki tasarruf çok daha büyük olacak diye bakarlarsa onlara mantıklı gelebilir
Yaklaşık 6 ay önce bir AWS çalışanından bizim kullanım senaryomuza uygun bir AI aracı sunumu dinledim
Sunum sırasında aniden ekran paylaşımında “Bu ay ne kadar token kullandığıma bakın. Opus’u deli gibi çalıştırıyorum” dedi ve sayı utandıracak kadar büyüktü
O anda “Acayip bir övünme. Bu zaten çok pahalı; çok kullanıyor olmak başlı başına bir tehlike işareti değil mi?” diye düşündüm
AWS altyapısını yönetmek ve ayarlamak için Claude Code kullanım örnekleri gösterdi ama internetten daha yaşlı gri sakallı bir sistem yöneticisi olarak bana göre bunlar “AI ile tek bir komutun yapacağı şeyi yapmış” gibi görünüyordu
O yüzden bu hikâye mantıklı geliyor. Demek ki 6 ay önce bile hunharca kullanmaları teşvik ediliyormuş
Ama
tabtuşuna basınca o satır AI tarafından düzenlenmiş satır olarak sayılıyorKalanların da önemli bir kısmı, çoklu imleç, vim gezintisi ve makroları öğrenmiş olsan zaten benzer hızda yapabileceğin işler
Gerçekte bunları kullanmasan da ekrana kod dökme hızının darboğaz olduğu kadar yavaş hiç olmadığım için öğrenmemiştim
Muhtemelen ikili bir durum değil ve çeşitli etkenlere göre değişiyor, ama birbirinden bu kadar farklı raporların aynı anda dolaşması garip
O zaman bu tür talimatların nereden geldiği ve neden temkinli ya da dengeli olmadıkları biraz daha anlaşılır oluyor
Bu, sistem geliştirmede büyük bir zayıflık ve saldırganlar için devasa bir saldırı yüzeyi olabilir
AI değerinin önemli kısmı tam da burada
Artık o komutu bilmek zorunda değilsin; sadece işlevsel sözleşmeyi bilirsen gereken işi yapabiliyorsun
Bu muazzam bir değişim
“Token kullanmak zorundaydım diye gereksiz yere yaktım” türü çok hikâye geliyor; iklim acil durumu varken bu inanılmaz bir davranış
Biraz daha zorlarsak 3 derecelik ısınmayı da görürüz herhalde
Kimsenin yemek istemediği balina eti kotasını tutturmak için Sovyetler’in balinaları neredeyse yok oluşa sürüklediği hikâyeyi hatırlatıyor
Fiilen merkezi planlama oluştu ve o sistemin patolojileri de aynen burada; Sovyetler’den farkı sadece bizim GOSPLAN’ı tesadüfen zengin olmuş ya da doğru kişilere rüşvet vermiş birkaç kişinin yönetmesi
Gerçek bir verimlilik artışı için değil, sadece token tüketmek için yani
Token yakmazsan KPI’larını tutturamazsın ve Luddite damgası yiyip, AI işini elinden almadan önce bile kapı önüne konabilirsin
Bu gidişatın ve savaş çığırtkanlarının dünyayı mahvettiği konusunda hemfikirim
“Kimse yemek istemiyordu” sözü de pek temellendirilmiş görünmüyor
Neyse ki uygulama yönetimi tarafında çalışıyorum ve sadece son kullanım tarihinin görülebildiğini öğrendim; günde bir sorgu atınca yeterli oluyor
Ama bu AI çılgınlığından gerçekten yoruldum
Bir FAANG şirketinde çalışıyorum ama Amazon değil; hem içeriden hem dışarıdan bu tür çok hikâye duydum
Ama önemli olan kişiler, yani liderlik, bunu resmen söyledi mi dersen bir kez bile duymadım
Hep söylentilerle ya da içeride birilerinin yaptığı dashboard’lar ve metriklerle başlayıp büyüyor
Liderlerin “Bizim baktığımız şey bu değil, pahalı tokenları israf etmeyin” dediğini de duydum
Elbette geçmişte satır sayısı ya da commit sayısı gibi saçma metrikleri kullandıkları zamanları tamamen inkâr etmiş değillerdi ama bunun ne kadar çok token o kadar iyi kadar basit olduğuna inanmıyorum
İtiraz ettiğimizde liderlik de token harcamasının iyi bir metrik olmadığını ve insanların bunu suistimal etme ihtimalinin yüksek olduğunu kabul ediyor, ama hemen ardından yine ekiplerin token harcamasını artırması söyleniyor
Liderliğin baktığı bir token takip dashboard’u var ve toplantıda doğrudan gösterildiği için bunu biliyorum
Henüz herkese bir sıralama tablosu gibi açmadılar, bari o var
Token harcamasının performans değerlendirmesine gireceğine dair çok söylenti var; liderlik inkâr ediyor ama hemen ardından token harcamasını artırmanın ne kadar önemli olduğuna dair yeni toplantılar yapıp dashboard’da görülen eksikleri konuşuyor
Token kullanım sıralaması yapan ya da AI araçlarını kullanmayı reddeden mühendislerin işten çıkarılabileceğini ima eden şirketlerde sorun patlıyor
Sonra hayatta kalmak için mümkün olduğunca çok token kullanma yarışı başlıyor
Özellikle sosyal medyayı çok takip eden geliştiriciler arasında daha da şiddetli
Twitter, Threads, Mastodon, LinkedIn gibi yerlerde AI-native olunması ve AI’ı yeterince kullanmayanların kovulması gerektiğine dair viral anlatılar dönüp dolaşıp yeniden servis ediliyor; kaygılı geliştiriciler de kaçınılmaz işten çıkarmalardan kaçmak için meslektaşlarından daha hızlı token yakmaları gerektiğini düşünüyor
Sonrasında organizasyondaki bireysel katkıcılar, yaptıkları her işte AI kullanmaları gerektiğini ve bunu yapmazlarsa kariyerlerinde olumsuz etkiler olabileceğini duydular
Günlük işlerde AI kullanımını motive etmek bahanesiyle zorunlu eğitimler, workshop’lar ve hackathon’lar arka arkaya geliyor
Shell script ile kolayca yapılacak işler için bile “Bunu nasıl bir ajana dönüştürebiliriz?” diye soruluyor
Copilot’a çok para harcandığı için insanların kullandığını görmek istiyorlar
Belki de amaç zaten insanların metriği oynamasını sağlamaktır
AI’ı daha fazla kullanmaya zorlarsan insanlar dener, deney yapar, “zaman kaybederek” öğrenir
Nihai amaç da budur
Şu an faydasız işlerde token harcayıp nerede işe yaradığını arıyorlar; nerede işe yaramadığını da ancak böyle öğrenebilirsin
Bizim şirket de aynısını yapıyor
İsraf olabilir ama AI’ın iş dünyasında gerçekten nerede işe yaradığını keşfetmenin en hızlı yolu bu
Çalışanların %80’i token israf etse bile kalan %20 bir yol buluyor
Parayı yakacak kadar çoksa daha kötü harcama yolları da düşünülebilir ama ciddiye alınca düpedüz aptalca
Şirketlerin milyonlarca dolar ve insanların zamanını harcayıp “bu araç ne işe yarayabilir” diye araştırdığı başka bir araç oldu mu
Bu, sorunu arayan çözümün ta kendisi
Bu aracın başta hangi problemi çözdüğü net değilse bırakıp geçmek gerekir
Artan para da çalışanlara ve hissedarlara verilse daha iyi olur
Ne yazık ki AI için artık bir evrensel temel iş programı var ama insanlar için hâlâ yok
Şirketler AI’a çukur kazsın diye para ödüyor, sonra başka bir AI gelip o çukuru doldursun diye tekrar para ödüyor
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
Sovyetler çok önce %100 istihdamı yakalamıştı[0], ona eşlik eden yoksullukla birlikte
Bu vergiyle yürüyen bir sistem değil, dolayısıyla birebir aynı değil
Özel şirketler kendi paralarıyla deney yapıyor ve maliyetlerin artıp müşterilerin başka yere gitmesi riskini de üstleniyor
Verimlilikten bağımsız biçimde zorla toplanan vergilerle insanlara para vermekten çok daha iyi
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Amazon içinde Kiro kullandığında token kullanımı oyunlaştırılmış durumda
Çünkü ekibine AWS’deki gibi maliyet yazılmıyor ya da eski sistemlerdeki gibi kapasiteyi açıklaman gerekmiyor
İnsanların, daha herhangi bir iç sıralamayı gören olmadan önce bile bu metriği oynadığına dair epey güvenilir şeyler duydum; aşırı hevesli kullanıcıların türlü türlü iç proje yapıp paylaşması da çok yaygın
İç sunumlarda N00% üretkenlik artışı gibi şeyler duyan yöneticilerin baskı yapması kesinlikle oluyor ama benim bulunduğum yerde gerçek iş yerine sahte iş üretmeye kalkarsan bunu oldukça hızlı fark ederler
Baskı daha çok agresif deadline’lar ve yıllık OP1 sürecinde daha çevik bir yönteme geçilmesinden geliyor
AWS’den ve AWS dışı başka FAANG çalışanlarından da benzer hikâyeler duydum
Tüm token sıralama tablolarında “Bu performans değerlendirmesine yansıtılmaz” şeklinde bir feragat notu var ama arkasından örtük bir göz kırpma hissi geliyor
Duyduğum bir organizasyonda GasTown’ı 7/24 çalıştırıp token tüketen biri var
Pek katkısı yok ama rahat rahat birinci sırada duruyor
GasTown çalıştırıyor ve ajanların codebase’in her yerine dokunmasına izin vererek günde 50 civarı commit çıkarıyor
Uyumluluk sürümleri, formatting falan
Ama sorun teknoloji değil, kişinin kendisi
LLM’lerden önce de zaten böyleydi
Repository’yi daha küçük repository’lere “refactor” edip bir anda bütün kodun üstünde kendi adı görünür hale getirirdi; üstünkörü bakınca şirket codebase’inin büyük parçalarını o yazmış sanırdın
Benim yapmak istediğim işleri reddedip sonra kendisi yapardı
Pull request’lerimde durmadan kusur bulur ya da o işin hiç yapılmaması gerektiğini söyler, sonra dönüp kendisi uygular
Kodumu kopyalayıp yapıştırmıyor ama benim PR açmamdan sonra, daha önce reddettiği aynı fikri tekrar hayata geçiriyor
Çok zeki ama çok dürüst olmayan biri ve dürüstsüzlüğünü iyi gizliyor
Sorarsan “bu yol daha derli toplu görünür diye düşündüm” gibi cevaplar veriyor
Dışarıdan bakıldığında bir yaklaşımın diğerinden daha iyi olduğu savunulabildiği için dürüstsüzlük net görünmüyor ama ben onun ne yaptığını %100 gördüğüm için örüntü tamamen açık
Ek olarak bir keresinde belli bir hafta izin alacağımı söylemiştim; açıkça reddetmedi ama The Thing’i teslim etme baskısı çok yüksek, izni erteleyebilir miyim diye sordu
Ben de “hayır, ertelemeyeceğim” dedim, o da onayladı ama o hafta geldiğinde kendisi de aynı hafta izin aldı
Bunu hiç gündeme getirmedim. Kendisi için asla kabul etmeyeceği şeyleri başkalarından istemekten utanmadığını anlamam için zaten yeterince örnek vardı
Amazon sözcüsü şirket genelinde AI kullanım metriği de, çalışanları birbiriyle kıyaslayan iç sıralama tabloları da olmadığını ve kişisel dashboard’da yalnızca kendi kullanımını görebildiklerini söylediyse düpedüz saçmalıyor
Kiro/QuickSuite(eski Amazon Q) kullanımını token bazında çalışan bazında sıralayan küresel bir dashboard var
Dashboard’un kendisi QuickSight’ta ve QuickSight da zaten QuickSuite’in bir parçası haline geldi
Veriler herkese açık olmakla kalmıyor, sıralama, günlük, haftalık, aylık ve yıllık kullanım bazında sıralanabiliyor
Şu anki çalışanlar ve eski çalışanlar da dahili alias’larıyla dahil
Üstelik PhoneTool profilinde görünen dahili bir “ödül” sistemi de var; her çalışan Kiro/AmazonQ/QuickSuite unvanları olan “Blaze”, “Thunderstorm” gibi etiketler alıyor
Aynı ödülü alan başka kişileri de tek tıkla görebiliyorsun
Bu arada PhoneTool, diğer çalışanlara bakabildiğin dahili profil dizini
Öte yandan düzgün kodu kendi başına yazamayan ya da bir şeye doğrudan entegre edemeyen birkaç kişi tanıyorum
Sürekli elinden tutulması gereken bu insanlar, Kiro/AmazonQ ile inanılmaz hacimde şey üretiyor ve bugünlerde SDE’lerden daha üst sıralarda yer alıyor
Bunlar daha çok SDE’den ziyade SysDev, destek mühendisi ya da TPM gibi kişiler
Bu tek başına mutlaka iyi ya da kötü demek değil ama token kullanımına göre stack ranking yaparsan “iyi” kod yazmaya çalışan iyi mühendislerin, özlü çözümler üretmeye çaba göstermeyen insanlardan daha aşağı değerlendirilmesi çok olası
Sonunda kalite düşecek ve liderlik ne olduğunu fark ettiğinde iş işten geçmiş olacak
Amazon-Q/Kiro ile ilgili arızaları şimdiden gördüm ama yine de inkâr ediyorlar
Bizim işyerine de bu dalga geliyor
Her gün MS Office Copilot kullanmazsan öfkeli bildirimler gönderiyor, ben de sadece Hello yazıyorum