7 puan yazan GN⁺ 5 시간 전 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Ajan tabanlı kodlama aracı Claude Code, kod yazmanın kendisinden çok, ürün geliştirme ve iş akışlarını yeniden yapılandırma konusunda daha büyük bir değişim yaratıyor
  • Microsoft’un iş amaçlı yapay zeka kullanıcıları araştırmasında, yapay zekayı hızla benimseme baskısı, yeni çıktılar üretme ve daha yüksek değerli işlere ayrılan zamanın artması birlikte görülürken, yapay zeka denemelerine verilen ödül düşük seviyede kaldı
  • Kurumlar yalnızca basit kullanım miktarını hedeflediğinde token lider tabloları ve kullanım şişirme ortaya çıkıyor; yapay zekayla değer üretme biçimiyle bağlantılı metrikler daha önemli
  • Boris Cherny, mühendis unvanının builder benzeri bir role dönüşebileceğini; mühendis olmayanların da kod üreteceğini, mühendislerin ise doğrudan yazı yazmaktan çok muhakeme, planlama ve kullanıcıyı anlamaya odaklanacağını düşünüyor
  • Yapay zekanın verimlilik artışı yalnızca çalışma saatlerinin veya iş sayısının azalmasına yol açmıyor; şirketler iş akışlarını yapay zeka merkezli yeniden yapılandırıyor ve bireyler daha geniş seçenekler ve kaldıraç kazanıyor

Yapay zeka iş verileri ve kurumsal metriklerin tuzakları

  • Microsoft, gerçek iş ortamında yapay zeka kullanan 20.000 kullanıcıyı araştırdı ve "dönüşüm paradoksu (transformation paradox)" adını verdiği bir olgu gözlemledi
    • %65’i, yapay zekayı hızlı benimsemezse geri kalmaktan endişe ediyor
    • %58’i, yapay zeka sayesinde 1 yıl önce üretemeyeceği çıktılar üretiyor
    • %66’sı, yapay zeka sayesinde daha yüksek değerli işlere zaman ayırabildiğini söylüyor
    • Buna karşılık iş yerinde yapay zeka deneyleri için ödüllendirildiğini söyleyenlerin oranı yalnızca %13, yani kullanım isteği ile kurum arasında bir boşluk var
  • Ayrı bir Microsoft araştırmasında yöneticilerin yapay zeka kullanımını doğrudan göstermesi kullanım oranını %17 artırırken, ajanlara duyulan güveni %30 yükseltti
    • "Yapay zeka gelecektir" türü sloganlardan çok, yöneticinin kendisinin gerçekten nasıl kullandığını somut biçimde göstermesi sonuç veriyor
    • Çalışanlar, yapay zekayla artan verimliliğin getirilerini paylaşabileceklerine inanırsa kullanım motivasyonu değişebilir; ancak bunu maddi olarak ödüllendiren yer neredeyse yok
  • Bazı iş yerleri token maliyetlerini sübvanse ediyor, ancak bu destek her zaman iyi sonuçlanmıyor

Token maxing — kullanım metriklerinin yan etkileri

  • Büyük teknoloji şirketlerinde token maxing, yani kullanım miktarını artırmak için aşırı token tüketme olgusu görülüyor
    • Financial Times’a konuşan Amazon çalışanlarına göre Amazon, OpenClaw’dan ilham alan şirket içi araç mesh claw’ı devreye aldı ve kullanımını teşvik etti
    • Ekip içinde token kullanım sıralama tablosu bulunduğundan, bazı çalışanlar üretken olmayan ajanları anlamsızca çalıştırarak kullanım miktarını yükseltiyor
    • Meta’da en yüksek kullanım yüz milyarlarca token düzeyindeydi ve milyonlarca dolarlık maliyete denk gelen miktar fiilen boşa harcandı
  • Amazon’un resmî pozisyonu, token kullanım miktarının yönetici değerlendirme metriği olmadığı yönünde; ancak çalışanlar yöneticilerin bunu gördüğünü düşündüğü için ham kullanım rakamlarını artırıyor
    • Amazon’da geliştiricilerin %80’inin her hafta yapay zeka kullanmasını hedefleyen üst düzey bir hedef bulunuyor
    • Somut ödül yoksa insanlar yalnızca "yapay zeka kullan" ifadesine uyup, asıl amaç olan "işi daha iyi yap" kısmını kaçırıyor
    • Geliştiricilerin, belirsiz izleme yöntemlerinden çok değer yaratımıyla bağlantılı üretken metriklere açık biçimde ihtiyacı var

Claude Code’un doğuşu ve hızlı yayılması

  • Claude Code, Anthropic’in önceki yılın mayıs ayında çıkardığı ajan tabanlı bir kodlama aracı; kelimeler girildiğinde kod üreten bir araç
    • Çıkışından 8 ay içinde GitHub’a yüklenen tüm kodun yaklaşık %4’ünü oluşturdu
    • Aynı yıl şubatta 2,5 milyar dolar yıllık gelir run rate seviyesine ulaştı; bu eşiğe en hızlı ulaşan kurumsal ürün oldu
    • Yaratıcısı Boris Cherny, bilgisayar bilimi diplomasına sahip değil; ekonomi okudu, 18 yaşında üniversiteyi bırakıp startup kurdu, hedge fund deneyiminin ardından Meta’da 5 yıl principal engineer olarak çalıştı ve 2024 sonunda Anthropic’e katıldı
    • Cherny bugün doğrudan tek satır kod yazmadan, 5 terminal sekmesinde 5 ajanı paralel çalıştırıp günde 20-30 pull request işliyor
  • Bir kodlama aracı yapma göreviyle değil, API’yi öğrenmeye çalışırken bir yan proje olarak başladı
    • İlk başta Claude’u AppleScript’e bağlayıp dinlediği müziği gösteren basit bir yapıydı
    • İki ay içinde Claude Code sürümü ortaya çıktı ve ilk günde Anthropic mühendislik ekibinin %20’si kullanmaya başladı
  • Eylül 2024’te katıldı ve çok küçük bir labs ekibine dahil oldu
    • Bu ekip Claude Code, MCP, skills ve masaüstü uygulamasını yaptı; başarıya ulaşıp ulaşmayacağı belli olmayan pek çok deneysel fikir vardı
    • Anthropic şimdiye kadar kurumsal kullanım, kodlama ve güvenliğe odaklanmıştı; ürün geliştirilecekse hem daha iyi kodlama modellerine hem de güvenlik araştırmalarına katkı sağlayacak bir kodlama ürünü mantıklı görüldü
  • O dönemde çoğu kodlama ürünü IDE eklentisi idi ve Sonnet 3.5 seviyesinde daha çok gelişmiş otomatik tamamlama gibiydi
    • Modellerin yapabildiği ama bunu ortaya çıkaracak ürünün olmadığı bir model overhang hissediliyordu; bu his bugün de aynı
    • Ayrı bir arayüz veya uygulama olmadan, terminalde çalışan en ucuz formda birkaç gün içinde üretildi
    • Kullanıcılar çevreden yayılmaya başladı; birkaç hafta içinde şirket içinde birçok kişi her gün kullanıyordu ve çıkıştan 5 gün sonra mühendislik ekibinin yarısı kullanıyordu
    • Terminalden hoşlanmayan mühendisler bile kullandı; Cherny de "yazılım mühendisliği sonsuza dek değişti" diye analiz etmekten çok yalnızca yayına odaklandı

Mühendisler yok oluyor mu — rollerin karışması

  • İlk şok, Claude’un dinlediği müziği söylediği an oldu
    • Soru üzerine Claude, müzik çaları açan AppleScript kodunu yazdı; Cherny bu dili bilmiyordu ve böyle bir yanıt vereceğini de düşünmemişti
    • Sorunu bir mühendisin seçmeyeceği bir yöntemle çözdü
  • Modeller çok hızlı geliştiği için, model üzerine ürün inşa ederken her ay yeniden ayar yapmak gerekiyor
    • Co-work ile 8 uçuş ve 5 otel rezervasyonu yaptı; tek hata gecelik yaklaşık 5.000 dolarlık bir otel seçmesi nedeniyle bütçeyi aşmasıydı → yalnızca o rezervasyon yeniden yapıldı
  • Eğilim üstel bir eğri ve kimse tam olarak bilmiyor; iki şey aynı anda oluyor
    • Mühendis verimliliği yükseldiği için aynı iş için daha az mühendise ihtiyaç duyan şirketler
    • Kişi başı verimlilik arttığı için daha fazla ürün ve iş geliştiren, dolayısıyla daha fazla mühendise ihtiyaç duyan şirketler (Cherny’nin ekibi de iyi mühendis eksikliği nedeniyle sürekli zorlanıyor ve mümkün olan en hızlı şekilde işe alım yapıyor)
  • Roller ilginç biçimde birbirine karışıyor
    • Yönetici Fiona 15 yıldır kod yazmamıştı ama katıldıktan sonra yazmaya başladı; ürün yöneticisi Cat ve tasarımcı Megan dahil ekipte herkes kod yazıyor
    • Mühendis olmayanlar biraz daha fazla kod yazarken, Cherny gibi mühendisler 6 aydan uzun süredir doğrudan kod yazmadan bütün gün bir şeyler üretiyor
    • Buna builder, engineer ya da product manager mı deneceği belirsiz, ama rolün kendisi açıkça değişiyor

Traktör benzetmesi — teknolojinin yayılma süresi

  • Traktör 1890’larda Iowa’da John Frick tarafından icat edildi, ancak ABD’de traktörlerin sayısının atları geçmesi 1960’ları buldu; yani yaklaşık 70 yıl sürdü
    • Traktör verim ve üretkenliği büyük ölçüde artırdı, ancak kullanımı öğrenmek için eğitim gerekiyordu ve ilk dönemde pahalı olduğu için at daha ucuzdu
    • Performansı da yetersizdi; örneğin buğdayda işe yarayıp mısırda yaramaması gibi durumlar vardı ve farklı ürünlere uyum sağlaması uzun sürdü
    • Bugünkü yapay zeka dönüşümünde aynı sorunlar çok yüksek hızda (speedrun) yaşanıyor
  • Bu, sıradan teknoloji olarak yapay zeka (AI as normal technology) bakışıyla bağlantılı: çok yetenekli modeller çıksa bile insanların ve kurumların değişimi yavaş ilerler
    • Ancak Anthropic’in gelir eğrisi bu kez hızın daha yüksek olduğu itirazını da doğuruyor; yani gerçek değişim hızını hâlâ ölçmeye çalışıyoruz
  • Bilgisayarlar verimliliği artırır, ama bu doğrudan çalışma saatlerinin azalacağı anlamına gelmez — aynı sürede daha fazla iş yapılır

Kodlama "çözüldü" mü?

  • "coding is solved" ifadesi, yalnızca "benim yaptığım türden kodlama" için kullanılıyor
    • Cherny’nin yaptığı cloud CLI, masaüstü uygulaması ve mobil uygulama, görece yeni ve basit kod tabanları
    • Buna karşılık NASA gibi büyük müşterilerin büyük ve karmaşık kod tabanlarında bu sorun henüz çözülmüş değil; modeller de kusursuz değil ve hata yapıyor
  • Mühendislerin itirazı — kodlamanın yalnızca yazı yazmak değil, muhakeme, sezgi ve eleştirel düşünme olduğu ve ajanların bu konuda zayıf kaldığı — geçerli
    • Cherny’nin geçmişte bir günü de yalnızca yaklaşık %50 gerçek kod yazımıydı; kalanı kullanıcı görüşmeleri, beyin fırtınası, debugging, tasarım ve planlamaydı
    • Model kodlamayı üstlendiğinde mühendis, kullanıcıyla konuşma ve bir sonrakini tasarlama gibi daha keyifli işlere serbest kalıyor
  • Claude Code, 6 aydan uzun süredir %100 Claude Code ile yazılıyor; Co-work gibi diğer ürünlerde de durum aynı
    • Son Y Combinator batch sohbetinde, "kodun %100’ünü Claude Code ile yazıyoruz" diyenler için yüzlerce kişi arasından yarısı el kaldırdı; "modellerle hiç yazmıyoruz" diyen ise yalnızca bir kişiydi, geri kalanlar %50-100 aralığındaydı
    • Mühendislikteki değişimin, mühendislik dışındaki tüm alanlar için öncü gösterge olduğu düşünülüyor
  • Yetkinlik körelmesi endişesi ve programlamanın evrimi

    • Doğrudan kod yazmamak, kişinin kendi mesleğine dair anlayışının körelmesine (atrophy) yol açabilir endişesi dile getiriliyor
      • Ekipteki mühendis Lena, keyif için hafta sonları elle C++ yazıyor; böyle bir alan her zaman var olabilir
      • Cherny ise bunu körelme değil, programlamanın hep değişen akışı olarak görüyor
        • Sovyet dönemindeki delikli kartlar, Apollo programı dönemindeki kâğıt üstünde elle yapılan hesaplar da o zamanın "programlaması"ydı
        • Sonra makine dili → assembly → JavaScript·Python geçişi yaşandı; şimdi de ajanlarla konuşarak programlama, yakında da ajanların ajanlara söyleyerek kodlaması yönünde yeni bir değişim bekleniyor
      • Bu, mühendislik hesap makinesi yüzünden matematik becerisinin bir miktar körelse de yine de hesap makinesi kullanmaya devam etmeye benziyor; ancak aracın süperzekâya dönüşüp kullanıcıyı fark edilmeden zayıflatması ayrı bir mesele
  • Model performansında gerileme tartışması

    • Yeni model çıktıktan sonra "performans ciddi biçimde geriledi" tepkisi düzenli olarak ortaya çıkıyor
      • Gerçekten bir bug’dan kaynaklanan 2 vaka oldu ve Anthropic bunun nedenini ve düzeltmesini blogunda paylaştı
      • Bunun dışındakilerin çoğu, modele alışıldıkça ilk hayranlığın sönmesi gibi bir balayı dönemi etkisi olabilir
    • 1 yıl öncesinden farklı olarak bugün modelin yazdığı kod, Cherny’nin kendisinin yazacağından daha iyi
      • Eskiden her satırı üç kez gözden geçirmek gerekirdi; şimdi işi Claude’a veriyor, sonucu yeniden kontrol ettirip test ettiriyor ve aynı anda 15 Claude’u paralel çalıştırıyor

Verimlilik paradoksu ve seçeneklerin genişlemesi

  • Verimlilik artsa da çalışma saatlerinin azalmaması, büyük ölçüde bireyin tercihine ve şirketin durumuna bağlı
  • Bu durum çamaşır makinesi hikâyesiyle anlatılıyor
    • Çamaşır makinesinden önce tek bir çamaşır yükü 5-6 saat sürüyor ve yaklaşık 3.000 ft yürümek gerekiyordu; ateş yakma, su kaynatma, çamaşır tahtasında ovalama ve sıkma işleri ailedeki kişi sayısı kadar her gün tekrarlanıyordu
    • Çamaşır makinesi tek bir yıkamada süreyi yaklaşık 3 saat kısalttı
    • Bu da kadınların iş gücü piyasasına kitlesel girişini mümkün kılan etkenlerden biri oldu
    • Kazanılan zaman çocuklarla vakit geçirme, yürüyüş, okuma, arkadaşlarla buluşma ya da fabrika ve ofis işlerine geçiş gibi kişisel seçenekler yarattı; yapay zeka da benzer şekilde seçenekleri genişletiyor
  • Bilgisayar bilimi diplomasını yeni bitirmiş 22 yaşındaki biri için tavsiye: junior pozisyonlar hâlâ var, ama biraz olsun girişimcilik eğilimi varsa startup kurması öneriliyor
    • Tarihte startup kurmak için en iyi altın çağ yaşanıyor ve "sen ve ajanların" devasa bir şirket kurabilirsiniz
    • Gerçekten de 1-3 kişilik ekipler milyar dolarlık şirketler ve olağanüstü girişimler çıkarıyor; tek bir kişinin kaldıracı çok büyük
  • 3 yıl sonra buna "mühendis" denmeyebilir, ama kod yazan veya ajanlarla kod üreten insanların sayısının bugünün 100 katına çıkacağı öngörülüyor

Claude Co-work — mühendis olmayanlar için genişleme

  • Co-work, insanların vergi beyanı yapmak için terminale Claude Code kurduğunu görünce başladı; yani kodlama dışı kullanım gözlemleniyordu
    • Muhasebe, finans, hukuk; uçuş rezervasyonu, konser bileti alma ve Washington eyaleti kabuklu deniz ürünü toplama izni satın alma gibi çok çeşitli mühendislik dışı işlerde kullanıldı
    • Kodlama ürünleri, mühendislerin kendileri için yapıp başkalarına da yararlı olan araçlardı; Co-work ise genel olarak mühendis olmayanlar için geliştirilen yeni bir meydan okuma
  • Uzun süre çalışma yeteneği temel yönlerden biri
    • Yaklaşık 1,5 yıl önce Claude Code, model sınırları nedeniyle 30 saniye geçince yoldan çıkıyor ve müdahale gerektiriyordu
    • Bugün her gece yüzlerce ila binlerce ajan 5, 10, 20 saat boyunca çalışıyor ve bugünün mühendislik biçimi bu
    • Co-work de aynı yöne gidecek, ancak hangi işlerin bu kadar uzun çalışmayı gerektireceği henüz net değil
  • Bellek ve kullanıcı anlayışı geliştikçe, sistem ihtiyaçları önceden tahmin etme yönünde ilerliyor
    • Örnek: kalan podcast bölümlerini ve henüz davet edilmemiş konukları tespit edip adaylar için beyin fırtınası yapmak, sonra ilk iletişim e-postalarını taslak klasörüne koymak
    • İş tanımı, "tüm tasarım" gibi yatay biçimde veya belirli bir hedefi uçtan uca tamamlayan dikey biçimde ayrılabilir
    • Dikey örnek: Claude’un bir özelliği geliştirip test etmesi, birleştirmesi ve yayına alması
  • Opus 4.7 ile birlikte Claude daha proaktif hale geldi
    • Özellik yayına alındıktan 12 saat sonra kullanıcı geri bildirimini kontrol etmek için kendi kendine hatırlatma planlıyor ve bug varsa düzeltmeye çalışıyor — insanların kolayca unuttuğu işleri önceden ele alması memnuniyeti artırdı
  • Claude Mythos çoğu kişi için dışarı açılmadı; paylaşılan bilgiler daha çok kodlama ve siber güvenlik performansı ile ilgili — olağan sıçramalardan daha büyük bir sıçrama ve özellikle siber güvenlik ile kodlamada güçlü

İşlerin yerini alma sorumluluğu kimin?

  • Bu dönüşümde iyi ve kötü etkiler birlikte geliyor; tam zamanlamayı ve oranı öngörmek mümkün değil
    • Anthropic, yazılım mühendisleri gibi mesleklerde işsizliğe yol açabilecek benzersiz bir konumda
    • Ekip içinde, mühendisler olarak yaklaşan değişimi duyurma ve insanlara araçları kullanmayı öğreterek onları birlikte taşımak gibi güçlü bir sorumluluk sık sık tartışılıyor
  • Bu, tek bir şirketin çözebileceği bir sorun değil; hatta tek şirketin çözmesi de arzu edilir değil (yanlış çözüme yol açabilir)
    • Toplumun tamamının tartışması gereken bir mesele ve Anthropic buna ekonomi raporları, politika tartışmaları ve gözlemlerini paylaşarak katkı vermeye çalışıyor
  • Anthropic’in bir güvenlik araştırma laboratuvarı olmasına rağmen ürün geliştirmesinin nedenlerinden biri de, insanların bunu doğrudan deneyimleyip anlaması ve toplumsal karşılığa katılması; teknoloji kilit altında tutulursa kimsenin görüş oluşturması zorlaşır

Güç kullanıcıları ve yapay zeka uçurumu

  • Dijital uçurumun yapay zeka uçurumuna dönüşmesi endişesi var; şimdiye kadarki veriler, yapay zekadan en iyi yararlanan kişilerin zaten gelir dağılımında üst gruplara daha yakın olduğunu gösteriyor
    • Anthropic’in erişilebilirliği artırmaya dönük bazı programları var, ancak somut isim ve yöntem verilmedi
  • En büyük değeri elde eden kullanıcılar çoğu zaman beklenenden farklı kişiler oluyor
    • Opus 4.7 çıkış hackathon’unun kazananları çoğunlukla profesyonel mühendisler değil, elektrikçi, doktor ve marangoz gibi kişilerin uygulama geliştirdiği örneklerdi; bir önceki 4.6 hackathon’unda da eğilim aynıydı
    • Modeller artık uzman olmayanların da iyi kullanabildiği kadar rafine hale geldi
  • Büyük şirketlerde benimsemenin kilidi, iş süreçlerini değiştirip Claude’u merkeze koymak
    • İşe yarayan yöntemlerden biri, herkese token verip güvenli biçimde deneme yapmasını sağlamak; böylece beklenmedik kişilerden fikir çıkabiliyor
    • En iyi fikir, kıdemli mühendisten değil köşedeki muhasebe çalışanı ya da GTM sorumlusunun geliştirdiği iç dashboard’dan gelebilir
    • Bugün aracı en iyi kullanan kişinin yarın da aynı kişi olacağının garantisi olmadığından, herkesin bu araçları kullanmayı öğrenmesi önemli

Önümüzdeki 1 yıla dair öngörü

  • Gelecek yıl çok fazla karmaşa olacak; büyük oyuncular uyum sağlamaya çalışacak ve bunların çoğu başarılı olacak
  • Bazı geleneksel iş hendekleri zayıflarken bazıları kalacak
    • Ağ etkileri (kullanıcı arttıkça değerin artması), yapay zekadan bağımsız olarak varlığını sürdürecek
    • Ölçek ekonomisi (marjinal maliyetlerin düşmesi) de doğal bir avantaj olarak kaybolmayacak
    • Buna karşılık geçiş maliyetleri zayıflıyor — Claude sizi vendor A’dan B’ye taşıyabiliyorsa artık büyük bir hendek sayılmaz
    • Kaybolan hendeklere dayanan şirketler zorlanacak, çoğu da yeni hendekler arayacak
  • Beklenenden çok daha büyük yenilikler yaşanacak
    • Yeni fikirler büyük şirketlerden değil, 1, 2, 10 kişilik küçük startup’lardan akacak ve sayıları patlayıcı biçimde artacak
    • Malzeme keşfi startup örneği: taş devri, demir devri ve silikon çağı anlatısından hareketle, yeni malzemeler bulunduğunda bir sonraki çağa geçileceği düşünülüyor ve Claude ile mümkün molekül ve tasarımlar araştırılıyor
    • Eskiden fon bulması bile zor olan işleri, küçük ekipler 20 yıl önce imkânsız görünen atılımlara dönüştürebiliyor
    • Alanını iyi bilen biri "Claude ordusu" kurduğunda, insan ordusunu yönettiğinden çok daha fazla işi başarabiliyor
  • Cherny, X ve Threads üzerindeki kullanıcı etkileşimini otomatikleştirmiş olsa da bunu bizzat yapmayı tercih ediyor
    • Claude Code döngüsünü rutin hale getirip her 30 dakikada bir çalıştırıyor, Threads API ve X API ile geri bildirim topluyor
    • Kullanıcıyla doğrudan etkileşim en sevdiği iş ve "çalışmıyor" geri bildirimi bile ürün geliştirmenin kaynağı
    • Claude Code’un çok kusuru var ve ideal üründen uzak, ancak geri bildirim dinleyip her gün biraz daha iyileştirmek iyi ürün yapmanın tek yolu

Henüz yorum yok.

Henüz yorum yok.