Kararlar ve Para: Şirketler “Anthropic bunu yaparsa?” sorusundan nasıl sağ çıkar?
(writing.nikunjk.com)- Yapay zeka modelleri güçlendikçe yazılımın kendi değeri düşüyor; hayatta kalmak isteyen uygulama şirketlerinin aynı anda veri şirketine ve fintech şirketine dönüşmesi gerekiyor
- Ajanlar yazılımın ana kullanıcısı hâline geldikçe kullanıcı başına fiyatlandırma modeli çöküyor; bin kişi yüz bin ajan çalıştırsa bile bu yüz bin koltuk etmez, bu yüzden geriye ücretlendirilebilecek yalnızca ajanların bıraktığı kararlar (veri) ve taşıdığı para (fintech) kalıyor
- Frontier modeller, şirketin nasıl işlediğini bilmeyen dâhiler topluluğu gibi; insanların sahip olduğu örtük muhakeme (judgment) asıl hendek ve kullanıcıların model sonuçlarını düzelttiği düzeltme geçmişi (corrections) hem öğrenme sinyali hem de test seti görevi görüyor
- Verinin içinden para akmıyorsa bu yalnızca bir bilim projesi; Toast, Ramp ve Shopify gibi ağ etkisi ve lock-in’i olan fintech yapıları, model fiyatları düşerken bile marjı koruyabiliyor
- Muhakemeyi biriktirmek, para akışını ele geçirmek ve yazmaları (writes) savunmak, Lab tüm token’ları görse bile vazgeçilmez bir şirket olarak kalmanın tek yolu
Modellerin gelişmesi ve yazılım değerinin düşmesi
- Dün Claude Fable 5 yayınlandı; halkın kullanabildiği ilk Mythos-class model ve neredeyse tüm benchmark’larda birinci, görev uzadıkça fark daha da açılıyor
- Model ne kadar akıllıysa yazılımın kendi değeri o kadar düşüyor
- Girişim sermayesi destekli her uygulama şirketi artık bir veri şirketi veya fintech şirketi, ideal olarak da ikisi birden olmak zorunda
Yazılımı kimin kullandığındaki değişim
- İki yıl önceki bir yazıda ajanlar kullanıcı hâline geldiğinde kullanıcı başına fiyatlandırma modelinin kırılacağı belirtilmişti; görünüşe göre o çizgi aşıldı
- Cloudflare, ajan trafiğinin ilk kez insan trafiğini geçtiğini açıkladı
- İnternette tartışmalar var, ancak ajanların tüm yazılımların ana müşterisi olma eğilimi açık
- Bin çalışanın yüz bin ajan çalıştırması, yüz bin koltuk anlamına gelmiyor
- Bir ajanın geride bıraktığı ücretlendirilebilir iki şey var: verdiği kararlar (=veri) ve taşıdığı para (=fintech)
Kararlar (Decisions) — veri hendeği
- xAI’nin Cursor’ı 60 milyar dolara satın alma opsiyonu var; Cursor’ın yıllıklandırılmış geliri yaklaşık 4 milyar dolar
- Yazılım için bu kadar yüksek bedel ödenmesinin ana nedeni bu değil
- Anthropic ve OpenAI, Claude Code ve Codex ile geliştirici çalışmalarını zaten gerçek zamanlı izliyor
- xAI’nin Cursor’ı almak istemesinin nedeni token akışına (token flow) en hızlı şekilde girmek
- Musk (dünyanın ilk trilyoneri), bir milyon geliştiricinin modeli gerçek hayatta kullanma kayıtlarının Grok eğitimine doğrudan girdiğini söyledi; yüksek fiyat, veriyi yavaşça toplamak için gereken yılları atlamanın geçiş ücreti
- Cursor piyasaya çıktıktan birkaç hafta sonra çalışan klonlar ortaya çıktı, ancak hiçbiri tutunamadı; çünkü rekabet zevk (taste) üzerinden dönüyordu
- Neyi göstereceğine ve ne zaman kaybolacağına dair binlerce küçük yargı
- Klonlar yalnızca arayüzü kopyalayabilir; geliştiricilerin yıllar boyunca kabul ettiği, reddettiği ve yeniden yazdığı kayıtları miras alamaz
- Cursor artık kendi modelini bu diff ile eğitiyor; veri birincil hendek hâline geldi
- 60 milyar dolarlık değerlemenin nedeni: çalışanların %90’ını şirketin nasıl işlediğini hiç bilmeyen bir dâhi ekibiyle değiştirmek gibi olması
- Fable 5, geçen yılın en iyi modelinin ancak yarısını çözebildiği gerçek yazılım görevlerinin %80’ini çözüyor; dâhileri birbirinden ayırt etmek zor ve değiştirilebilirler
- Başarısız olmalarının tek nedeni var: Yerine geçtikleri insanların bildiği şeyleri kimse bilmiyor
Örtük bilgi (tacit knowledge) ve muhakemenin birikimi
- Geçici çözüm, insanların zihnindeki bilgiyi çıkarıp modele bağlam olarak vermek; ancak bunların çoğu yapılandırılmış biçimde mevcut değil
- Vazgeçilen anlaşmalar, gece 2’de geri alınan tek satır kod, kimsenin peşinden koşmadığı ve nedeni yazılmamış bir müşteri — asıl öz bunlar
- Bunlar workflow olarak yazılamayan yargılar ve bugün kaydedilmiyor
- Artık context → harness → judgment yönünde ilerleniyor
- Context, arama/getirme (retrieval): doğru parçaları modelin önüne koymak
- Harness, modelin içinde çalışabileceği döngü (scaffolding)
- Judgment son katman ve bileşik şekilde biriken tek katman; her çağrının, düzeltmenin ve geri almanın verinin üzerinde bıraktığı iz
- Bugün görülen her yapay zeka uygulaması sunumunda context slaydı hendek olarak öne sürülüyor, ama artık bu sadece oyuna giriş şartı
- Çünkü tüm rakipler bağlamı aynı şekilde bir araya getiriyor
Düzeltme kayıtlarının (corrections) iki rolü
- Düzeltmeler bir skor kartı (scorecard) olarak görülebilir; kullanıcı model çıktısını her düzelttiğinde, o işte neyin doğru olduğu kayda geçer
- Skor kartı aynı anda iki iş yapar
- Ödünç alınan modeli o işe göre ayarlayan öğrenme sinyali
- Ajanın gerçekten gelişip gelişmediğini bilmenin tek yolu olan test seti; açık benchmark’lar belirli bir workflow’u ölçemez
- Başlangıçtan itibaren modeli önceden eğitmeye gerek yok; Cursor bile bunu yapmıyor
- Cursor’ın kendi modeli açık kaynak bir tabanın üzerine kurulu ve farklılaşmayı diff sağlıyor
- Frontier modeller üzerinde fine-tuning ve RL maliyeti yeterince ucuzladı; artık Series B aşamasındaki bir şirket de bu döngüyü çalıştırabilir, iki yıl önce bunun için lab gerekirdi
- Sarah Guo bu alanı the untrainable (dışarıdan doğru cevabı puanlayamayacağınız işler) diye adlandırıyor; düzeltmeler bunun sahiplenilme yolu
Dikey (vertical) yapay zeka liderlerinden örnekler
- Harvey 11 milyar doları, Legora 5 milyar doları aştı; ikisi de hukuk pazarını hedefliyor
- Bağımsız araç olmanın ötesine geçip davanın/işin (matter) tamamına sahip olmaya koşuyorlar; çünkü avukatın taslağa yaptığı düzeltmeler kimsenin göremediği corrections
- Rogo finans alanında aynı stratejiyi izliyor; analistin model oluşturma ve notu düzeltme sürecini yakalıyor
- Bunların hiçbiri foundation model eğitmiyor; ödünç alınmış bir modelin etrafına harness inşa ediyor ve onun içinden akan judgment’a sahip oluyorlar; bileşik şekilde biriken şey bu
- Mevcut güçlü oyuncularda da durum aynı
- Figma, SVG’den fazlasına sahip; tasarımın v1’den v47’ye giden tarihi ve yolda çöpe atılan tüm sürümler — tasarım zevkinin puanlanmış kaydı
- Linear, kapatılan her ticket’ın altındaki tartışmalara sahip
- Notion, binlerce düzenleme boyunca bir ekibin düşünce biçimine sahip
- Rakipler müşteriyi almaya çalışsa da bunların hiçbiri export edilemez; bunlar jenerik modelde olmayan cevaplar
Lab’lerin muhakemeyi satın alma akımı
- Lab’ler muhakemeyi hazır ürün gibi satın almaya başladı; insan etiketli verilerle başladılar
- Mercor 10 milyar dolar değerlemede; uzman ağına saat başına 85 dolar ödüyor
- Meta, pipeline’a sahip olmak için Scale’e 14 milyar dolar ödedi
- New York’taki bir startup, tüm sürecin kayda alınmasına izin verilirse daireleri ücretsiz temizliyor; çünkü robotik ekipleri, insanın bir sonraki eyleme nasıl karar verdiğini görmek zorunda
- Çok sayıda RL environment şirketi uzun görevler için muhakeme satıyor ve yüz milyonlarca dolarlık yıllıklandırılmış gelire ulaşıyor
- Lab’ler tüm internetle eğitim yapıp tükendi; şimdi kararları doğrudan satın alıyorlar
Para (Dollars) — fintech hendeği
- 23andMe, on beş milyon kişinin DNA’sına sahip olmasına rağmen geçen yıl iflas etti
- Verinin içinden para akmıyorsa bu, bilim projesi fon kuyruğunda beklemekten ibaret
- Kurucuların çoğu bu yarıyı kaçırıyor
- Toast bunu yıllar önce fark etti; restoran özünde mutfak eklenmiş bir ödeme işlemcisidir
- Ödemeler, yazılımdan çok daha büyük gelir üretir
- Ramp daha da ileri gitti; ücretsiz kurumsal kartta hiçbir yerde ücret yok, bir milyar dolar aktığında her dolardan 1–2 cent alıyor
- Yuvarlama hatasıyla kurulmuş 32 milyar dolarlık şirket; ücretsiz kart, interchange’e açılan ön kapı
- Swipe fee, ağın dayanması sayesinde korunuyor; para beklerken de float topluyor ve gelir sağlıyor
- Her para sayacının hendeği yok
- Popüler bir vibe-coding uygulaması sattığı kredilerden yaklaşık %50 marj elde ediyor; yıllıklandırılmış gelirinin çoğu çıkarım (inference) üzerine konan mark-up
- Token mark-up’ının arkasında ağ yok ve kendi çıkarım maliyeti de her çeyrek düşüyor; model ucuzladıkça marj eriyor
- Sürdürülebilir fintech, altında lock-in olan şeydir — ağın ayakta tuttuğu ödemeler, bankanın göremediği veriyle teminatlandırılan krediler
Ajanlar için ödeme altyapısı
- Ajanlar için ödeme altyapısı nihayet çalışmaya başladı
- Ajan uçak bileti ayırdığında, parça sipariş ettiğinde ve tedarikçiye ödeme yaptığında, bir şeyin ücreti onaylaması, taşıması ve komisyon alması gerekir
- Stripe bunun için bir protokol yayınladı; Visa ve Mastercard standardı kapma yarışında
- OpenAI, kendi ajanlarının satın aldığı her şeyden şimdiden birkaç yüzde puan kesiyor
- Bir trilyon ajanın işlemleri yakında tarihin en büyük ödeme ekonomisine dönüşecek
Birini diğerine dönüştürmek
- Uzun ömürlü en iyi uygulama şirketleri bu iki yarıyı ayrı ele almaz
- Judgment, işle ilgili kararların kaydıdır; fintech, parayla ilgili kararların kaydıdır; güçlü şirketler birini diğerine dönüştürür
- Shopify bunun en iyi örneği
- Mağaza yazılımıyla başladı → ödemeleri ekledi → Shopify Capital ile mağazadan akan gelir verisiyle teminatlandırılmış krediler sundu; bankaların tek başına veremeyeceği krediler
- Satıcı büyüdükçe gelir artar, veri de bir sonraki krediye yardımcı olur
- Bugün Shopify gelirinin yaklaşık dörtte üçü yazılım aboneliklerinden değil, para tarafından geliyor
- Stripe, Radar ile; Ramp, harcama verisi ve kartla aynı döngüyü işletiyor
- Rippling de benzerini deniyor; temel nesne çalışan
- Maaş, yan haklar, cihazlar ve kartlar tek bir source of truth’a dayanıyor
- Henüz kimse lock-in yaratamadı ve Gusto ile Deel de paralel büyüyor; ancak nesneye sahip olan şirket bileşik şekilde biriktirirken diğerleri elle birleştiriyor
Yazmaları savun (Guard the writes)
- Kimsenin çözemediği “headless” bir gerilim var
- Tüm yazılımlar ajanlar tarafından kullanılmaya başladığında, faydalı olmak için ajanları içeri almak gerekir; hayatta kalmak içinse her şeyi alıp götürmelerine izin verilemez
- Her system of record, ajanların herhangi bir protokolle bağlanabileceği kadar açık, ama gerekeni aldıktan sonra kimsenin ayrılamayacağı kadar kapalı olmalı
- Salesforce bu yıl Slack verilerini Glean ve dış ajanlara kapattı; bunu açıkça yapan ilk örnek
- Sürdürülebilir şirket kurmanın yolu ayırmaktan geçiyor
- Ajanların okumasına izin ver; okuma ucuzdur ve zaten önemlidir
- Yazmaları savun
- Yeni muhakemenin girildiği, insanların ve ajanların birbirini onayladığı, düzelttiği ve geri aldığı nokta; rakiplerin kolayca taşıyamayacağı kısımdır
- Onların kazıyıp aldığı şey dünkü durumdur; yalnızca şu anda verilen kararlar sizin olarak kalır
“Anthropic bunu yaparsa?”
- Lab’ler zaten token akışının içindeyken hendeğin nerede olduğu sorulabilir
- Claude Code, geliştiricinin çalıştırdığı her komutu ve görmezden geldiği önerileri görüyor; ChatGPT ise bir ürünün bir yılda kaydettiğinden daha fazla kararı bir günde gözlemliyor
- Bu itiraza cevap: Araçlarının gördüğü şeylerin çoğu jenerik
- Tüm modellerin gördüğü aynı kodlama ve yazma; lab’lerin birbirini commoditize etmek için yarıştığı şey de tam olarak bu
- Nadir muhakeme, bir şirketin derinlerinde bulunur — bir hastanenin taramaları okuma biçimi, bir şirketin vazgeçmeyi öğrendiği anlaşmalar; bunların hiçbiri lab’in sohbet kutusuna ulaşmaz
- Lab’ler yıllardır şirketlere onların verileriyle eğitim yapmadıklarını söylüyor
- Ürün içindeki modelden geçen örtük bilgi sözleşmeyle şirketin kendisinde kalır; lab’ler trace’in geçtiğini görür ama saklamamayı kabul eder
- Fintech yarısı ise lab’in zaten istemediği şeydir
- Lab veriyi memnuniyetle alır; ama loan book, dolandırıcılık kayıpları ve 40 eyaletteki money-transmitter lisansları işine yaramaz
- Alıcı için veri, satın almaya değer yaratır; fintech ise sökülüp ayrılmayı zorlaştırır
- Cursor, kategorisinin en iyi veri motorunu kurdu ve bir lab onu 60 milyar dolara satın aldı
- Bunun bir rüya mı yoksa uyarı mı olduğunu, değiştirmek için çok geç olana kadar bilemezsiniz
- Hayatta kalan iki şeyi inşa edin: muhakemeyi biriktirmek ve paranın geçtiği boğaza oturmak; “Anthropic bunu yaparsa?” sorusuna dayanmanın yolu bu
2 yorum
Kulağa bir şekilde makul geliyor ama anlaması zor.
Yargıların birikimi ve para akışını kontrol etme, ayrıca yazma (writes) savunması; laboratuvar (lab) tüm token’ları görse bile ikame edilemez bir şirket olarak kalmanın tek yolu -> Bunun anlamı biraz belirsiz; acaba biraz daha açıklayabilir misiniz?