- Forbes’un aktardığı Claude Code Max planı için 5 bin dolarlık hesap, gerçek hesaplama maliyetine değil API perakende fiyatına dayanıyor
- OpenRouter’daki Qwen 3.5 397B ve Kimi K2.5 model fiyatlarıyla karşılaştırıldığında, benzer ölçekte modellerin Anthropic API ücretlerinin yaklaşık onda biri seviyesinde çalıştırıldığı görülüyor
- Bu ölçüte göre hesaplandığında, Anthropic’in tahmini gerçek maliyeti yaklaşık 500 dolar; yani bazı yoğun kullanıcılar için aylık zarar yalnızca 300 dolar düzeyinde kalıyor
- Kullanıcıların çoğu token sınırına ulaşmıyor ve ortalama kullanım temel alındığında yapı başabaş ya da kârlı görünüyor
- Yapay zeka çıkarım maliyetlerinin aşırı yüksek olduğu algısı bir yanlış anlama ve bu algı, büyük yapay zeka şirketlerinin yüksek API marjlarını meşrulaştırmak için kullanılıyor
Forbes’un 5 bin dolar iddiasının doğrulanması
- Forbes, Cursor ile ilgili bir haberde Anthropic’in 200 dolarlık planının 5 bin dolar değerinde hesaplama kullanımına izin verdiğini aktardı
- Bu alıntı, “şirketin hesaplama kullanım kalıplarına ilişkin analizi gören bir kişi”nin sözü olarak sunuldu
- Ancak bu rakam, API perakende fiyatı üzerinden yapılmış bir hesap; gerçek hesaplama maliyetiyle aynı şey değil
- Anthropic’in Opus 4.6 API fiyatlandırması girdi için milyon token başına 5 dolar, çıktı için milyon token başına 25 dolar olarak belirlenmiş durumda
- Bu oranla hesaplandığında, ağır kullanıcılar ayda 5 bin dolarlık API kullanımına ulaşabiliyor
Gerçek hesaplama maliyetinin tahmini
- OpenRouter’da benzer ölçekteki Qwen 3.5 397B-A17B modeli girdi için milyon token başına 0,39 dolar, çıktı için 2,34 dolar seviyesinde
- Kimi K2.5 modeli ise girdi için 0,45 dolar, çıktı için 2,25 dolar ile daha da ucuz
- Bu da, Anthropic API fiyatlarına kıyasla yaklaşık 10 kat daha ucuz bir düzeye işaret ediyor
- Önbellek token maliyetleri de benzer oranda farklılık gösteriyor
- Örneğin DeepInfra’da Kimi K2.5 önbellek okuma maliyeti 0,07 dolar/MTok iken Anthropic’te 0,50 dolar/MTok
- Bu nedenle gerçek hesaplama maliyetinin, API fiyatının yaklaşık %10’u düzeyinde olduğu tahmin edilebilir
Claude Code Max kullanıcılarının gerçek maliyeti
- API fiyatına göre 5 bin dolar değerinde token kullanan bir kullanıcının gerçek maliyeti yaklaşık 500 dolar düzeyinde
- Bu durumda Anthropic’in aylık zararı yaklaşık 300 dolar oluyor
- Ancak Anthropic, kullanıcıların %5’inden azının token sınırına ulaştığını söylüyor
- Sıradan kullanıcılar ise ortalama olarak token kotasının %50’sinden azını kullanıyor
- Anthropic’in
/cost verilerine göre ortalama kullanıcı günde yaklaşık 6 dolarlık API kullanımı yapıyor, kullanıcıların %90’ı ise 12 doların altında kalıyor
- Gerçek maliyet bazında bu, ayda yaklaşık 18 dolara denk geliyor ve 20–200 dolarlık abonelik ücretlerine karşı kârlılık sağlanabileceğini gösteriyor
Cursor ile maliyet farkı
- 5 bin dolarlık rakam, Cursor’un iç analiz sonuçlarından kaynaklanıyor
- Cursor, Opus 4.6’yı Anthropic’in perakende API fiyatıyla kullanmak zorunda
- Bu nedenle Cursor açısından bir güç kullanıcısı için aylık 5 bin dolarlık maliyet oluşabiliyor
- Buna karşılık Anthropic’in gerçek maliyeti yaklaşık 500 dolar seviyesinde
- Cursor, geliştiricilerin Anthropic modellerini tercih etmesi nedeniyle zorlanıyor
Anthropic’in gelir yapısı ve yanlış algı
- Anthropic, eğitim maliyetleri, personel giderleri ve büyük ölçekli hesaplama yatırımları nedeniyle genel olarak hâlâ zarar eden bir yapıda
- Ancak token bazlı çıkarım (inference) maliyetinin yüksek olasılıkla kârlı olduğu düşünülüyor
- “Yapay zeka çıkarımı zarar eden bir iş” algısı, API fiyatlarındaki aşırı marjı meşrulaştırıyor ve rekabeti zayıflatıyor
- Gerçek çıkarım ekonomisini anlamak için OpenRouter’daki açık model fiyatlarına bakmak daha gerçekçi
- Bunlar, büyük yapay zeka şirketlerinin API ücretlerine kıyasla gerçek maliyetin yalnızca bir kısmı düzeyinde kalıyor
1 yorum
Hacker News görüşleri
Qwen 3.5 397B-A17B'yi Anthropic modelleriyle karşılaştırmak saçma bir kıyaslama
Qwen ve DeepSeek gibi Çin modellerinin Anthropic'ten 10 kattan fazla daha verimli olduğu söyleniyor
OpenRouter fiyatlarıyla resmî sağlayıcı fiyatları arasında büyük fark olmamasının nedeni de bu. Üstelik OpenRouter sağlayıcılarının hangi quantization yöntemlerini kullandığı da belirsiz. Gerçekte 100 kat verim sağlıyor olmaları bile mümkün
Elbette tüm kullanıcılar planı son sınırına kadar kullanmadığı için, kullanıcı başına 5.000 dolar zarar edilmiyor
Amazon Bedrock'taki Opus 4.5 ile Çin modellerinin t/s değerlerine bakınca benzer düzeyde oldukları görülüyor; dolayısıyla gerçek aktif parametre sayısı da benzer
OpenRouter'da BF16 veya Q8 sağlayıcılarını doğrudan seçmek de mümkün
Çinli şirketler GPU kıtlığı yaşıyor ama çıkarım verimliliği konusunda çok yenilik yaptılar. DeepSeek CEO'su Liang da bu konudaki makalelerin yazarları arasında
Anthropic model mimarisini ya da parametre sayısını hiç açıklamadı
Açık kaynak modellerin çoğu başka modellerden distill edilir ya da hesaplama maliyetini düşürmek için MoE kullanır
Qwen'i kıyas ölçütü alan blog yazısına güvenmek zor
Asıl makaleye göre Cursor, geçen yıl aylık 200 dolarlık Claude Code aboneliğinin en fazla 2.000 dolarlık işlem gücü kullandığını tahmin etmişti
Şimdi bu sübvansiyon daha da büyümüş durumda; aynı planın yaklaşık 5.000 dolarlık işlem tüketebildiği söyleniyor
Pek çok kişi OpenAI ve Anthropic'in token'ları zararına sattığına inanıyor ama buna dair gerçek kanıt neredeyse yok
Bu meme, Forbes'taki hatalı bir yazı yüzünden yayıldı. O yazı API maliyeti ile işlem maliyeti arasındaki farkı bile anlamıyordu
Anthropic'in CC dışı kullanımı engellemesi ve API harcama limitinin 5.000 dolar olması gibi işaretler, kârlılığın düşük olabileceğini düşündürüyor
Araştırma, eğitim ve altyapı personel maliyetlerinin hepsi token üretim maliyetine dahil edilmeli
Açık ağırlıklı modellerin düşük fiyatı, pazar payı kazanmak için yapılan dampingden kaynaklanıyor; gerçek maliyet daha yüksek
Sonuçta bu yapı uzun süre sürdürülebilir olmayacak
Model sürekli eğitilmezse token'ın değeri düşer
Ekibimiz Claude Code'u API üzerinden kullansaydı aylık 200 bin dolar öderdik ama gerçekte Max abonelikleriyle ayda sadece 1.400 dolar veriyoruz
Kullanıcı başına 50 bin dolar seviyesinde görünüyor ama JSON token sayılarına bakılırsa bunun çoğu önbelleğe alınmış istekler, yani gerçek maliyet muhtemelen çok daha düşük
Gerçek maliyet muhtemelen 25 bin ila 30 bin dolar aralığında. Forbes'un 5 bin dolarlık tahmini abartılı
npx ccusageile yerel loglara bakıp API bazlı maliyeti hesaplayabilirsinizAnthropic'in işlem kapasitesi tamamen doluysa, Claude Code'un yoğun kullanıcıları kullanıcı başına 5.000 dolarlık bir fırsat maliyeti yaratabilir
Ama bu kıyas, Rolex ile markasız bir saatin dişli sayısını karşılaştırmak kadar uygunsuz
Anthropic için de benzer şekilde, kullanıcıların belirsiz kaliteye şüpheyle yaklaşması ya da API tabanlı ücretlendirmeye geçmesi daha olası
Çıkarım maliyeti ve kâr marjı, açık ağırlıklı modellerle büyük bulut sağlayıcıları arasında ciddi biçimde farklı
Bu durum, ilaç sektöründeki Ar-Ge maliyeti ile jenerik üretim maliyeti farkına benziyor
OpenAI'nin çıkarım marjının yaklaşık %70, Anthropic'in ise %40 ila %90 aralığında olduğu tahmin ediliyor
İlgili yazılar: Phemex, SaaStr, The Information, Investing.com
Muhasebe açısından bakıldığında model başına gelir eğitim maliyetini zaten karşılamış olabilir
Ancak nakit akışı açısından şirket hâlâ cashflow positive değil
Bu fark anlaşılmazsa yapay zeka sektörünün geneli olduğundan küçük görülür
Opus 4.6'nın model boyutunun ne olduğu konusunda emin değilim
Qwen397B'den çok daha büyük olduğunu tahmin ediyorum
Anthropic API'den para kazanıyor olabilir ama %90 marj seviyesinde değildir muhtemelen
Önbellek neredeyse bedava gibi, ama gerçekte tamamen ücretsiz değil
Önbellek token maliyetini çıkarınca 200 dolarlık aboneliğin gerçek işlem kullanımı yaklaşık 800 dolara düşüyor
İşlem kapasitesinin büyük kısmı muhtemelen boşta duruyor
Önbellek isabet etmezse bu kez fırsat maliyeti oluşur
Cursor, Anthropic'in perakende API fiyatı üzerinden Opus 4.6 kullanmak zorunda olduğu için, yoğun kullanıcı başına ayda 5.000 dolar maliyet oluşabilir
Buna karşılık Anthropic'in gerçek maliyeti muhtemelen 500 dolar düzeyindedir
Yakın zamanda Swix podcast'inde Cursor'un bulut agent stratejisini dinledim; giriş engelleri düşüyor
Claude aboneliği spot instance kavramına daha yakın
API ise on-demand hizmet ve öncelik API tarafında
Boşta kalan işlem gücü abonelere ayrılıyor; kapasite yetersizse quantized düşük maliyetli modellere yönlendirme yapılıyor
Bu tür abonelikler atıl kaynakları değerlendiriyor ve öngörülebilir iş akışlarıyla model eğitiminin kalitesini artırmaya da yardımcı oluyor
Qwen Code, Codex ve Claude'un üçünü de kullandım; Codex, Qwen'den 2 kat, Claude ise Codex'ten 2 kat daha iyiydi
Bu yüzden Claude Opus'un Qwen Code'dan 4 ila 5 kat daha pahalı olacağını düşünüyorum