- LLM token maliyetlerinin her yıl 10 kat düşeceği beklentisinin aksine, AI abonelik hizmetlerinde kârlılık giderek daha da kötüleşiyor
- En yeni LLM modellere yönelik talep her zaman en üst düzey (SOTA, State-of-the-art) modellere yoğunlaştığı için, “eski” modellerdeki fiyat düşüşü fiili maliyet azaltımına dönüşmüyor
- Model performansı arttıkça kullanılan token miktarı geometrik olarak artıyor; bu da birim fiyat düşüşünü telafi etmekle kalmayıp toplam maliyeti daha da yukarı taşıyor
- Sınırsız abonelik planı denemeleri (ör. Claude Code $200/ay) bile ağır kullanıcıların token patlaması nedeniyle sürdürülemez durumda
- Uzun vadede kullanım bazlı ücretlendirme dışında sürdürülebilir bir model yok; ancak startup rekabeti ve tüketici direnci nedeniyle bunun pratikte uygulanması zor
- Sürdürülebilir bir gelir modeline geçilmezse çoğu startup sonunda iflas riskiyle karşı karşıya kalacak
AI abonelik işi, token birim fiyatı düşse de neden zarar büyüyor?
LLM fiyat düşüşü yanılsaması
- Kurucular, "token birim fiyatı 10 kat düşüyor; biraz daha dayanırsak yüksek marjlı yapıya geçeriz" şeklindeki VC oyun kitabına inanarak başlangıçta maliyet seviyesinde ya da zararla abonelik ürünleri işletiyor
- Gerçekte GPT-3.5 gibi eski modellerde token birim fiyatı 10 katın üzerinde düşmüş olsa da, kullanıcıların ve pazarın talebi her zaman en yeni ve en yüksek performanslı (SOTA) modellere kayıyor
- Pratikte ise 18 ay geçmesine rağmen marjlar iyileşmek yerine daha da bozuluyor
- Eski model fiyat indirimlerinin hissedildiği tek durum, bunların "dünün gazetesi" gibi artık pazarın ilgisi dışında kalması
En yeni modellerin fiyatı ve talep yapısı
- GPT-4, Claude 3 Opus gibi en yeni modeller her zaman benzer derecede yüksek fiyatlarla piyasaya çıkıyor; eski modeller ne kadar ucuzlarsa ucuzlasın gerçek kullanım miktarı çok düşük kalıyor
- Kullanıcılar yalnızca "en iyi performansı" istiyor; "ucuz eski model" ise otomobil pazarındaki eski ikinci el araçtan farksız
- AI kullanırken aslında istenen şey en iyi sonuç olduğu için, maliyetten tasarruf etmek adına kullanıcıların gönüllü olarak eski modeli seçtiği durumlar nadir
- Sonuçta pazarda rekabetçi kalmak için her zaman en pahalı en yeni modeli sunmak gerekiyor ve bu da maliyet tabanını yüksek tutuyor
- Tıpkı 90'lı yıllardan kalma ikinci el araçların fiyatı düşse de tüketicinin yine de yeni araba almayı tercih etmesi gibi
Token kullanımındaki patlayıcı artış
- Model performansı yükseldikçe, tek bir işin tükettiği token miktarı geometrik olarak artıyor
- Eskiden 1.000 token ile biten bir iş, artık 100.000 token tüketebiliyor
- Önceden tek cümlelik bir sorgu tek cümlelik bir yanıtla çözülürken, bugün karmaşık araştırma, loop ve orkestrasyon süreçleriyle 10-20 dakika boyunca kesintisiz çalışıp devasa miktarda token harcanıyor
- AI'a daha derin araştırma/analiz yaptırıldıkça, "tek çalıştırmada 20 dakika, günde 24 saat kesintisiz çalışma" gibi senaryolar nedeniyle kullanıcı başına günlük ortalama kullanım hızla artıyor
- Örneğin her gün yalnızca 1 kez, $1 maliyetli bir 'deep research' kullanılsa bile, $20 abonelik ücretiyle bu iş sürdürülebilir olmuyor
- Birim fiyat düşüşü toplam token tüketimindeki artışla dengeleniyor ve $20/ay planıyla günde bir kez yapılan $1'lık işi bile karşılamak imkânsız hale geliyor
Sınırsız planların başarısızlığı
- Anthropic'in Claude Code'u gibi hizmetler $200/ay sınırsız planlar, otomatik token optimizasyonu ve kullanıcının PC'sinden yararlanma gibi çeşitli maliyet azaltma yöntemlerini denedi
- Ancak bazı güçlü kullanıcılar ayda 10 milyar tokene ("War and Peace"in 12.500 kitaplık hacmine) yaklaşarak, otomasyon, tekrar eden işler ve loop'larla token tüketimini patlattı
- "AI kullanımı insan zamanından kopuyor ve API 24 saat çalışarak token patlamasına yol açıyor"
- Mühendislik yeniliklerine rağmen sonunda planlar geri çekildi
- Sonuç: artık sınırsız abonelik modeli mümkün değil; denklem kendi başına işlemiyor
Tüm sektörün karşı karşıya olduğu ikilem
- Abonelik modelinde ısrar edilirse kârlılık daha da kötüleşiyor ve çöküş riski büyüyor
- AI şirketleri çözümün usage-based pricing olduğunu biliyor; ancak abonelik temelli bir rakip çıktığında kullanıcı kaybı riski çok yüksek
- "Mahkûm ikilemi" yapısı nedeniyle herkes ağır kullanıcı sübvansiyonu yarışına sürükleniyor
- Cursor, Replit gibi şirketler de "önce büyüme, kârlılık sonra" yaklaşımıyla ilerliyor; ama sonunda kârlılık sorunu nedeniyle yeniden yapılanma kaçınılmaz görünüyor
Gerçekçi 3 çözüm
- 1. Kullanım bazlı ücretlendirme
- Başından itibaren dürüst bir ekonomik model kurulursa, maliyeti aşmayan bir gelir yapısı tasarlanabilir. Uzun vadede sürdürülebilir olan tek model bu
- Ancak tüketiciler ölçüme dayalı ücretlendirmeyi son derece sevmez; bu yüzden kitlesel başarı elde etmek zor olabilir
- 2. Yüksek geçiş maliyetine dayalı kurumsal pazar stratejisi
- Yüksek geçiş maliyetine sahip kurumsal müşterilere (ör. büyük şirketler, finans kurumları) B2B satış yaparak pazara bir kez girildiğinde iptal neredeyse imkânsız hale gelir ve marjlar yükselir
- System of Record (SOR, CRM/ERP/EHR vb.) alanı bunun tipik başarı örneği (ör. Goldman Sachs için 40 bin mühendise dağıtım)
- 3. Dikey entegrasyonla katma değer yaratma (Vertical Integration)
- Replit örneğinde olduğu gibi, LLM inference tarafı zarar edilen bir "yem ürün" olarak sunulup bunun üzerine kurulan hosting, veritabanı, deployment, monitoring gibi hizmetlerden gelir elde edilebilir
- AI kullanımını artırıp bunu altyapı pazarına bağlayan bir yapı kurmak
- Önümüzdeki dönemde token birim fiyatı düşmeye devam etse bile, kullanıcı beklentileri ve kullanım miktarı da geometrik olarak artacak
- Yalnızca abonelik + büyüme stratejisinde ısrar eden şirketlerin sonunda 'yüksek maliyetli bir cenaze töreni' yaşama riski büyük
Özet
- "Gelecek yıl tokenlar 10 kat daha ucuz olacak" iyimserliği tek başına bir işi ayakta tutmaya yetmiyor
- Kullanıcılar her zaman daha yüksek beklenti ve daha fazla kullanım talep ediyor
- Model ilerlemesi = kullanım patlaması = maliyet artışı formülü artık geçerli; bu yüzden sürdürülebilir AI işi, kullanım bazlı fiyatlandırma, büyük kurumsal sözleşmeler ve dikey entegrasyonla kurulan yeni bir yapıya geçmek zorunda
- İşin sürmesini istiyorsanız 'neocloud' stratejisi gibi yeni yapısal yaklaşımlar gerekli
Henüz yorum yok.