13 puan yazan GN⁺ 2025-08-04 | Henüz yorum yok. | WhatsApp'ta paylaş
  • LLM token maliyetlerinin her yıl 10 kat düşeceği beklentisinin aksine, AI abonelik hizmetlerinde kârlılık giderek daha da kötüleşiyor
  • En yeni LLM modellere yönelik talep her zaman en üst düzey (SOTA, State-of-the-art) modellere yoğunlaştığı için, “eski” modellerdeki fiyat düşüşü fiili maliyet azaltımına dönüşmüyor
  • Model performansı arttıkça kullanılan token miktarı geometrik olarak artıyor; bu da birim fiyat düşüşünü telafi etmekle kalmayıp toplam maliyeti daha da yukarı taşıyor
  • Sınırsız abonelik planı denemeleri (ör. Claude Code $200/ay) bile ağır kullanıcıların token patlaması nedeniyle sürdürülemez durumda
  • Uzun vadede kullanım bazlı ücretlendirme dışında sürdürülebilir bir model yok; ancak startup rekabeti ve tüketici direnci nedeniyle bunun pratikte uygulanması zor
  • Sürdürülebilir bir gelir modeline geçilmezse çoğu startup sonunda iflas riskiyle karşı karşıya kalacak

AI abonelik işi, token birim fiyatı düşse de neden zarar büyüyor?

LLM fiyat düşüşü yanılsaması

  • Kurucular, "token birim fiyatı 10 kat düşüyor; biraz daha dayanırsak yüksek marjlı yapıya geçeriz" şeklindeki VC oyun kitabına inanarak başlangıçta maliyet seviyesinde ya da zararla abonelik ürünleri işletiyor
  • Gerçekte GPT-3.5 gibi eski modellerde token birim fiyatı 10 katın üzerinde düşmüş olsa da, kullanıcıların ve pazarın talebi her zaman en yeni ve en yüksek performanslı (SOTA) modellere kayıyor
  • Pratikte ise 18 ay geçmesine rağmen marjlar iyileşmek yerine daha da bozuluyor
  • Eski model fiyat indirimlerinin hissedildiği tek durum, bunların "dünün gazetesi" gibi artık pazarın ilgisi dışında kalması

En yeni modellerin fiyatı ve talep yapısı

  • GPT-4, Claude 3 Opus gibi en yeni modeller her zaman benzer derecede yüksek fiyatlarla piyasaya çıkıyor; eski modeller ne kadar ucuzlarsa ucuzlasın gerçek kullanım miktarı çok düşük kalıyor
  • Kullanıcılar yalnızca "en iyi performansı" istiyor; "ucuz eski model" ise otomobil pazarındaki eski ikinci el araçtan farksız
  • AI kullanırken aslında istenen şey en iyi sonuç olduğu için, maliyetten tasarruf etmek adına kullanıcıların gönüllü olarak eski modeli seçtiği durumlar nadir
  • Sonuçta pazarda rekabetçi kalmak için her zaman en pahalı en yeni modeli sunmak gerekiyor ve bu da maliyet tabanını yüksek tutuyor
    • Tıpkı 90'lı yıllardan kalma ikinci el araçların fiyatı düşse de tüketicinin yine de yeni araba almayı tercih etmesi gibi

Token kullanımındaki patlayıcı artış

  • Model performansı yükseldikçe, tek bir işin tükettiği token miktarı geometrik olarak artıyor
  • Eskiden 1.000 token ile biten bir iş, artık 100.000 token tüketebiliyor
  • Önceden tek cümlelik bir sorgu tek cümlelik bir yanıtla çözülürken, bugün karmaşık araştırma, loop ve orkestrasyon süreçleriyle 10-20 dakika boyunca kesintisiz çalışıp devasa miktarda token harcanıyor
  • AI'a daha derin araştırma/analiz yaptırıldıkça, "tek çalıştırmada 20 dakika, günde 24 saat kesintisiz çalışma" gibi senaryolar nedeniyle kullanıcı başına günlük ortalama kullanım hızla artıyor
    • Örneğin her gün yalnızca 1 kez, $1 maliyetli bir 'deep research' kullanılsa bile, $20 abonelik ücretiyle bu iş sürdürülebilir olmuyor
  • Birim fiyat düşüşü toplam token tüketimindeki artışla dengeleniyor ve $20/ay planıyla günde bir kez yapılan $1'lık işi bile karşılamak imkânsız hale geliyor

Sınırsız planların başarısızlığı

  • Anthropic'in Claude Code'u gibi hizmetler $200/ay sınırsız planlar, otomatik token optimizasyonu ve kullanıcının PC'sinden yararlanma gibi çeşitli maliyet azaltma yöntemlerini denedi
  • Ancak bazı güçlü kullanıcılar ayda 10 milyar tokene ("War and Peace"in 12.500 kitaplık hacmine) yaklaşarak, otomasyon, tekrar eden işler ve loop'larla token tüketimini patlattı
    • "AI kullanımı insan zamanından kopuyor ve API 24 saat çalışarak token patlamasına yol açıyor"
  • Mühendislik yeniliklerine rağmen sonunda planlar geri çekildi
  • Sonuç: artık sınırsız abonelik modeli mümkün değil; denklem kendi başına işlemiyor

Tüm sektörün karşı karşıya olduğu ikilem

  • Abonelik modelinde ısrar edilirse kârlılık daha da kötüleşiyor ve çöküş riski büyüyor
  • AI şirketleri çözümün usage-based pricing olduğunu biliyor; ancak abonelik temelli bir rakip çıktığında kullanıcı kaybı riski çok yüksek
  • "Mahkûm ikilemi" yapısı nedeniyle herkes ağır kullanıcı sübvansiyonu yarışına sürükleniyor
  • Cursor, Replit gibi şirketler de "önce büyüme, kârlılık sonra" yaklaşımıyla ilerliyor; ama sonunda kârlılık sorunu nedeniyle yeniden yapılanma kaçınılmaz görünüyor

Gerçekçi 3 çözüm

  • 1. Kullanım bazlı ücretlendirme
    • Başından itibaren dürüst bir ekonomik model kurulursa, maliyeti aşmayan bir gelir yapısı tasarlanabilir. Uzun vadede sürdürülebilir olan tek model bu
    • Ancak tüketiciler ölçüme dayalı ücretlendirmeyi son derece sevmez; bu yüzden kitlesel başarı elde etmek zor olabilir
  • 2. Yüksek geçiş maliyetine dayalı kurumsal pazar stratejisi
    • Yüksek geçiş maliyetine sahip kurumsal müşterilere (ör. büyük şirketler, finans kurumları) B2B satış yaparak pazara bir kez girildiğinde iptal neredeyse imkânsız hale gelir ve marjlar yükselir
    • System of Record (SOR, CRM/ERP/EHR vb.) alanı bunun tipik başarı örneği (ör. Goldman Sachs için 40 bin mühendise dağıtım)
  • 3. Dikey entegrasyonla katma değer yaratma (Vertical Integration)
    • Replit örneğinde olduğu gibi, LLM inference tarafı zarar edilen bir "yem ürün" olarak sunulup bunun üzerine kurulan hosting, veritabanı, deployment, monitoring gibi hizmetlerden gelir elde edilebilir
    • AI kullanımını artırıp bunu altyapı pazarına bağlayan bir yapı kurmak
  • Önümüzdeki dönemde token birim fiyatı düşmeye devam etse bile, kullanıcı beklentileri ve kullanım miktarı da geometrik olarak artacak
  • Yalnızca abonelik + büyüme stratejisinde ısrar eden şirketlerin sonunda 'yüksek maliyetli bir cenaze töreni' yaşama riski büyük

Özet

  • "Gelecek yıl tokenlar 10 kat daha ucuz olacak" iyimserliği tek başına bir işi ayakta tutmaya yetmiyor
    • Kullanıcılar her zaman daha yüksek beklenti ve daha fazla kullanım talep ediyor
  • Model ilerlemesi = kullanım patlaması = maliyet artışı formülü artık geçerli; bu yüzden sürdürülebilir AI işi, kullanım bazlı fiyatlandırma, büyük kurumsal sözleşmeler ve dikey entegrasyonla kurulan yeni bir yapıya geçmek zorunda
    • İşin sürmesini istiyorsanız 'neocloud' stratejisi gibi yeni yapısal yaklaşımlar gerekli

Henüz yorum yok.

Henüz yorum yok.