Anthropic için Claude Code kullanıcı başına 5 bin dolarlık maliyet iddiası doğru değil

(martinalderson.com)

1 puan yazan GN⁺ 2026-03-11 | 1 yorum | WhatsApp'ta paylaş

Forbes’un aktardığı Claude Code Max planı için 5 bin dolarlık hesap, gerçek hesaplama maliyetine değil API perakende fiyatına dayanıyor
OpenRouter’daki Qwen 3.5 397B ve Kimi K2.5 model fiyatlarıyla karşılaştırıldığında, benzer ölçekte modellerin Anthropic API ücretlerinin yaklaşık onda biri seviyesinde çalıştırıldığı görülüyor
Bu ölçüte göre hesaplandığında, Anthropic’in tahmini gerçek maliyeti yaklaşık 500 dolar; yani bazı yoğun kullanıcılar için aylık zarar yalnızca 300 dolar düzeyinde kalıyor
Kullanıcıların çoğu token sınırına ulaşmıyor ve ortalama kullanım temel alındığında yapı başabaş ya da kârlı görünüyor
Yapay zeka çıkarım maliyetlerinin aşırı yüksek olduğu algısı bir yanlış anlama ve bu algı, büyük yapay zeka şirketlerinin yüksek API marjlarını meşrulaştırmak için kullanılıyor

Forbes’un 5 bin dolar iddiasının doğrulanması

Forbes, Cursor ile ilgili bir haberde Anthropic’in 200 dolarlık planının 5 bin dolar değerinde hesaplama kullanımına izin verdiğini aktardı
- Bu alıntı, “şirketin hesaplama kullanım kalıplarına ilişkin analizi gören bir kişi”nin sözü olarak sunuldu
Ancak bu rakam, API perakende fiyatı üzerinden yapılmış bir hesap; gerçek hesaplama maliyetiyle aynı şey değil
Anthropic’in Opus 4.6 API fiyatlandırması girdi için milyon token başına 5 dolar, çıktı için milyon token başına 25 dolar olarak belirlenmiş durumda
- Bu oranla hesaplandığında, ağır kullanıcılar ayda 5 bin dolarlık API kullanımına ulaşabiliyor

Gerçek hesaplama maliyetinin tahmini

OpenRouter’da benzer ölçekteki Qwen 3.5 397B-A17B modeli girdi için milyon token başına 0,39 dolar, çıktı için 2,34 dolar seviyesinde
- Kimi K2.5 modeli ise girdi için 0,45 dolar, çıktı için 2,25 dolar ile daha da ucuz
Bu da, Anthropic API fiyatlarına kıyasla yaklaşık 10 kat daha ucuz bir düzeye işaret ediyor
Önbellek token maliyetleri de benzer oranda farklılık gösteriyor
- Örneğin DeepInfra’da Kimi K2.5 önbellek okuma maliyeti 0,07 dolar/MTok iken Anthropic’te 0,50 dolar/MTok
Bu nedenle gerçek hesaplama maliyetinin, API fiyatının yaklaşık %10’u düzeyinde olduğu tahmin edilebilir

Claude Code Max kullanıcılarının gerçek maliyeti

API fiyatına göre 5 bin dolar değerinde token kullanan bir kullanıcının gerçek maliyeti yaklaşık 500 dolar düzeyinde
- Bu durumda Anthropic’in aylık zararı yaklaşık 300 dolar oluyor
Ancak Anthropic, kullanıcıların %5’inden azının token sınırına ulaştığını söylüyor
- Sıradan kullanıcılar ise ortalama olarak token kotasının %50’sinden azını kullanıyor
Anthropic’in /cost verilerine göre ortalama kullanıcı günde yaklaşık 6 dolarlık API kullanımı yapıyor, kullanıcıların %90’ı ise 12 doların altında kalıyor
- Gerçek maliyet bazında bu, ayda yaklaşık 18 dolara denk geliyor ve 20–200 dolarlık abonelik ücretlerine karşı kârlılık sağlanabileceğini gösteriyor

Cursor ile maliyet farkı

5 bin dolarlık rakam, Cursor’un iç analiz sonuçlarından kaynaklanıyor
- Cursor, Opus 4.6’yı Anthropic’in perakende API fiyatıyla kullanmak zorunda
Bu nedenle Cursor açısından bir güç kullanıcısı için aylık 5 bin dolarlık maliyet oluşabiliyor
- Buna karşılık Anthropic’in gerçek maliyeti yaklaşık 500 dolar seviyesinde
Cursor, geliştiricilerin Anthropic modellerini tercih etmesi nedeniyle zorlanıyor

Anthropic’in gelir yapısı ve yanlış algı

Anthropic, eğitim maliyetleri, personel giderleri ve büyük ölçekli hesaplama yatırımları nedeniyle genel olarak hâlâ zarar eden bir yapıda
Ancak token bazlı çıkarım (inference) maliyetinin yüksek olasılıkla kârlı olduğu düşünülüyor
“Yapay zeka çıkarımı zarar eden bir iş” algısı, API fiyatlarındaki aşırı marjı meşrulaştırıyor ve rekabeti zayıflatıyor
Gerçek çıkarım ekonomisini anlamak için OpenRouter’daki açık model fiyatlarına bakmak daha gerçekçi
- Bunlar, büyük yapay zeka şirketlerinin API ücretlerine kıyasla gerçek maliyetin yalnızca bir kısmı düzeyinde kalıyor

1 yorum

GN⁺ 2026-03-11

Hacker News görüşleri

Qwen 3.5 397B-A17B'yi Anthropic modelleriyle karşılaştırmak saçma bir kıyaslama
Qwen ve DeepSeek gibi Çin modellerinin Anthropic'ten 10 kattan fazla daha verimli olduğu söyleniyor
OpenRouter fiyatlarıyla resmî sağlayıcı fiyatları arasında büyük fark olmamasının nedeni de bu. Üstelik OpenRouter sağlayıcılarının hangi quantization yöntemlerini kullandığı da belirsiz. Gerçekte 100 kat verim sağlıyor olmaları bile mümkün
Elbette tüm kullanıcılar planı son sınırına kadar kullanmadığı için, kullanıcı başına 5.000 dolar zarar edilmiyor
- Bu döngüsel bir mantık. Çin modelinin 10 kat daha verimli olduğuna inanılmasının tek nedeni 10 kat ucuz olması
  Amazon Bedrock'taki Opus 4.5 ile Çin modellerinin t/s değerlerine bakınca benzer düzeyde oldukları görülüyor; dolayısıyla gerçek aktif parametre sayısı da benzer
  OpenRouter'da BF16 veya Q8 sağlayıcılarını doğrudan seçmek de mümkün
- Katılıyorum ama Opus 4.6'nın 10 kat daha büyük bir model olma ihtimali yüksek. GPT-4 zaten 1.6T bir modeldi ve Llama 4 de çok daha büyük
  Çinli şirketler GPU kıtlığı yaşıyor ama çıkarım verimliliği konusunda çok yenilik yaptılar. DeepSeek CEO'su Liang da bu konudaki makalelerin yazarları arasında
- Qwen gibi açık kaynak modelleri Anthropic ile karşılaştırmak anlamsız
  Anthropic model mimarisini ya da parametre sayısını hiç açıklamadı
  Açık kaynak modellerin çoğu başka modellerden distill edilir ya da hesaplama maliyetini düşürmek için MoE kullanır
  Qwen'i kıyas ölçütü alan blog yazısına güvenmek zor
- Opus, TPU kullanarak daha düşük maliyete ulaşmış olabilir
- OpenRouter sağlayıcı bölümünde quantization bilgisi gösteriliyor
Asıl makaleye göre Cursor, geçen yıl aylık 200 dolarlık Claude Code aboneliğinin en fazla 2.000 dolarlık işlem gücü kullandığını tahmin etmişti
Şimdi bu sübvansiyon daha da büyümüş durumda; aynı planın yaklaşık 5.000 dolarlık işlem tüketebildiği söyleniyor
- Buna gelen tepki: "Bu her şeyi değiştiren bir bilgi"
Pek çok kişi OpenAI ve Anthropic'in token'ları zararına sattığına inanıyor ama buna dair gerçek kanıt neredeyse yok
Bu meme, Forbes'taki hatalı bir yazı yüzünden yayıldı. O yazı API maliyeti ile işlem maliyeti arasındaki farkı bile anlamıyordu
- Ama gerçekte zararına satış olduğuna dair kanıt yok diye kesin konuşmak da zor
  Anthropic'in CC dışı kullanımı engellemesi ve API harcama limitinin 5.000 dolar olması gibi işaretler, kârlılığın düşük olabileceğini düşündürüyor
- "Sadece token satan bir şirket nasıl zarar etmez ki" diyenler de var
  Araştırma, eğitim ve altyapı personel maliyetlerinin hepsi token üretim maliyetine dahil edilmeli
  Açık ağırlıklı modellerin düşük fiyatı, pazar payı kazanmak için yapılan dampingden kaynaklanıyor; gerçek maliyet daha yüksek
  Sonuçta bu yapı uzun süre sürdürülebilir olmayacak
- Anthropic'in token başına zarar edip etmediğinden çok, eğitim maliyetinin ne kadar olduğu daha önemli
  Model sürekli eğitilmezse token'ın değeri düşer
- İlgili belgeler burada
Ekibimiz Claude Code'u API üzerinden kullansaydı aylık 200 bin dolar öderdik ama gerçekte Max abonelikleriyle ayda sadece 1.400 dolar veriyoruz
Kullanıcı başına 50 bin dolar seviyesinde görünüyor ama JSON token sayılarına bakılırsa bunun çoğu önbelleğe alınmış istekler, yani gerçek maliyet muhtemelen çok daha düşük
- Bunu hangi işleri bu kadar verimli dağıtarak yaptıklarını merak ediyorum. Ben de Claude'u çok kullanıyorum ama limite çabuk ulaşıyorum
- Gemini CLI oturum başına önbellek tasarruf oranını gösteriyor; genelde %90 civarında
- Ben de birden fazla Claude agent çalıştırıyorum; giriş token'larının %85'i önbellek okuması
  Gerçek maliyet muhtemelen 25 bin ila 30 bin dolar aralığında. Forbes'un 5 bin dolarlık tahmini abartılı
- npx ccusage ile yerel loglara bakıp API bazlı maliyeti hesaplayabilirsiniz
- Ama Max planını şirket amaçlı kullanmak kullanım şartlarını ihlal etmek olmuyor mu, bunu merak ediyorum
Anthropic'in işlem kapasitesi tamamen doluysa, Claude Code'un yoğun kullanıcıları kullanıcı başına 5.000 dolarlık bir fırsat maliyeti yaratabilir
Ama bu kıyas, Rolex ile markasız bir saatin dişli sayısını karşılaştırmak kadar uygunsuz
- Fırsat maliyeti gerçek maliyet değildir. Asıl mesele Anthropic'in abonelik satamayacak kadar dolu olup olmadığı
- GPU çiftliği ne kadar tam kullanılırsa, batching etkisi sayesinde birim maliyet o kadar düşer
- Eğlence sektöründe de "fırsat maliyeti" ifadesi sık kullanılır ama gerçekte olan şey çoğunlukla tüketimin düşmesidir
  Anthropic için de benzer şekilde, kullanıcıların belirsiz kaliteye şüpheyle yaklaşması ya da API tabanlı ücretlendirmeye geçmesi daha olası
- "100 dolarlık abonelikle Opus'u bol bol kullandığım bu düzenin sürmesini diliyorum" diye şaka yapanlar da var
Çıkarım maliyeti ve kâr marjı, açık ağırlıklı modellerle büyük bulut sağlayıcıları arasında ciddi biçimde farklı
Bu durum, ilaç sektöründeki Ar-Ge maliyeti ile jenerik üretim maliyeti farkına benziyor
OpenAI'nin çıkarım marjının yaklaşık %70, Anthropic'in ise %40 ila %90 aralığında olduğu tahmin ediliyor
İlgili yazılar: Phemex, SaaStr, The Information, Investing.com
- "Kâr" kelimesini fazla rahat kullanmayalım diyenler var
  Muhasebe açısından bakıldığında model başına gelir eğitim maliyetini zaten karşılamış olabilir
  Ancak nakit akışı açısından şirket hâlâ cashflow positive değil
  Bu fark anlaşılmazsa yapay zeka sektörünün geneli olduğundan küçük görülür
Opus 4.6'nın model boyutunun ne olduğu konusunda emin değilim
Qwen397B'den çok daha büyük olduğunu tahmin ediyorum
- Musk'ın Grok'un trilyonlarca parametreye sahip olduğunu söylemesine bakılırsa, Opus da o seviyede olabilir
  Anthropic API'den para kazanıyor olabilir ama %90 marj seviyesinde değildir muhtemelen
- OpenRouter'da DeepSeek v3.2 (685B/37B active) $0.26/0.40, Kimi K2.5 (1T/32B active) ise $0.45/2.25 olarak fiyatlanmış
- Uzman biri tahminde bulunsa Opus'un 1 ila 2 trilyon parametre civarında olduğunu söylerdi
Önbellek neredeyse bedava gibi, ama gerçekte tamamen ücretsiz değil
Önbellek token maliyetini çıkarınca 200 dolarlık aboneliğin gerçek işlem kullanımı yaklaşık 800 dolara düşüyor
İşlem kapasitesinin büyük kısmı muhtemelen boşta duruyor
- Ama önbellek RAM'i sürekli işgal ettiği için tamamen ücretsiz sayılmaz
  Önbellek isabet etmezse bu kez fırsat maliyeti oluşur
- Önbellek sayesinde daha fazla kullanıcıya premium fiyatla çıkarım satılabildiği için, aslında geliri maksimize etme aracı işlevi görüyor
- Eğer bu gerçekten boşta duran işlem değilse, o kaynaklar model eğitimi ya da araştırma deneyleri için de kullanılabilir
Cursor, Anthropic'in perakende API fiyatı üzerinden Opus 4.6 kullanmak zorunda olduğu için, yoğun kullanıcı başına ayda 5.000 dolar maliyet oluşabilir
Buna karşılık Anthropic'in gerçek maliyeti muhtemelen 500 dolar düzeyindedir
Yakın zamanda Swix podcast'inde Cursor'un bulut agent stratejisini dinledim; giriş engelleri düşüyor
Claude aboneliği spot instance kavramına daha yakın
API ise on-demand hizmet ve öncelik API tarafında
Boşta kalan işlem gücü abonelere ayrılıyor; kapasite yetersizse quantized düşük maliyetli modellere yönlendirme yapılıyor
Bu tür abonelikler atıl kaynakları değerlendiriyor ve öngörülebilir iş akışlarıyla model eğitiminin kalitesini artırmaya da yardımcı oluyor
Qwen Code, Codex ve Claude'un üçünü de kullandım; Codex, Qwen'den 2 kat, Claude ise Codex'ten 2 kat daha iyiydi
Bu yüzden Claude Opus'un Qwen Code'dan 4 ila 5 kat daha pahalı olacağını düşünüyorum
- "Claude, Codex'ten 2 kat daha iyi" kısmı artık doğru değil
- "Kapasite yetersiz kalınca düşük maliyetli modele yönlendiriliyor" kısmı resmî olarak hiç açıklanmadı

Anthropic için Claude Code kullanıcı başına 5 bin dolarlık maliyet iddiası doğru değil

Forbes’un 5 bin dolar iddiasının doğrulanması

Gerçek hesaplama maliyetinin tahmini

Claude Code Max kullanıcılarının gerçek maliyeti

Cursor ile maliyet farkı

Anthropic’in gelir yapısı ve yanlış algı

İlgili okumalar

1 yorum

Hacker News görüşleri