1 puan yazan GN⁺ 2026-03-11 | 1 yorum | WhatsApp'ta paylaş
  • Forbes’un aktardığı Claude Code Max planı için 5 bin dolarlık hesap, gerçek hesaplama maliyetine değil API perakende fiyatına dayanıyor
  • OpenRouter’daki Qwen 3.5 397B ve Kimi K2.5 model fiyatlarıyla karşılaştırıldığında, benzer ölçekte modellerin Anthropic API ücretlerinin yaklaşık onda biri seviyesinde çalıştırıldığı görülüyor
  • Bu ölçüte göre hesaplandığında, Anthropic’in tahmini gerçek maliyeti yaklaşık 500 dolar; yani bazı yoğun kullanıcılar için aylık zarar yalnızca 300 dolar düzeyinde kalıyor
  • Kullanıcıların çoğu token sınırına ulaşmıyor ve ortalama kullanım temel alındığında yapı başabaş ya da kârlı görünüyor
  • Yapay zeka çıkarım maliyetlerinin aşırı yüksek olduğu algısı bir yanlış anlama ve bu algı, büyük yapay zeka şirketlerinin yüksek API marjlarını meşrulaştırmak için kullanılıyor

Forbes’un 5 bin dolar iddiasının doğrulanması

  • Forbes, Cursor ile ilgili bir haberde Anthropic’in 200 dolarlık planının 5 bin dolar değerinde hesaplama kullanımına izin verdiğini aktardı
    • Bu alıntı, “şirketin hesaplama kullanım kalıplarına ilişkin analizi gören bir kişi”nin sözü olarak sunuldu
  • Ancak bu rakam, API perakende fiyatı üzerinden yapılmış bir hesap; gerçek hesaplama maliyetiyle aynı şey değil
  • Anthropic’in Opus 4.6 API fiyatlandırması girdi için milyon token başına 5 dolar, çıktı için milyon token başına 25 dolar olarak belirlenmiş durumda
    • Bu oranla hesaplandığında, ağır kullanıcılar ayda 5 bin dolarlık API kullanımına ulaşabiliyor

Gerçek hesaplama maliyetinin tahmini

  • OpenRouter’da benzer ölçekteki Qwen 3.5 397B-A17B modeli girdi için milyon token başına 0,39 dolar, çıktı için 2,34 dolar seviyesinde
    • Kimi K2.5 modeli ise girdi için 0,45 dolar, çıktı için 2,25 dolar ile daha da ucuz
  • Bu da, Anthropic API fiyatlarına kıyasla yaklaşık 10 kat daha ucuz bir düzeye işaret ediyor
  • Önbellek token maliyetleri de benzer oranda farklılık gösteriyor
    • Örneğin DeepInfra’da Kimi K2.5 önbellek okuma maliyeti 0,07 dolar/MTok iken Anthropic’te 0,50 dolar/MTok
  • Bu nedenle gerçek hesaplama maliyetinin, API fiyatının yaklaşık %10’u düzeyinde olduğu tahmin edilebilir

Claude Code Max kullanıcılarının gerçek maliyeti

  • API fiyatına göre 5 bin dolar değerinde token kullanan bir kullanıcının gerçek maliyeti yaklaşık 500 dolar düzeyinde
    • Bu durumda Anthropic’in aylık zararı yaklaşık 300 dolar oluyor
  • Ancak Anthropic, kullanıcıların %5’inden azının token sınırına ulaştığını söylüyor
    • Sıradan kullanıcılar ise ortalama olarak token kotasının %50’sinden azını kullanıyor
  • Anthropic’in /cost verilerine göre ortalama kullanıcı günde yaklaşık 6 dolarlık API kullanımı yapıyor, kullanıcıların %90’ı ise 12 doların altında kalıyor
    • Gerçek maliyet bazında bu, ayda yaklaşık 18 dolara denk geliyor ve 20–200 dolarlık abonelik ücretlerine karşı kârlılık sağlanabileceğini gösteriyor

Cursor ile maliyet farkı

  • 5 bin dolarlık rakam, Cursor’un iç analiz sonuçlarından kaynaklanıyor
    • Cursor, Opus 4.6’yı Anthropic’in perakende API fiyatıyla kullanmak zorunda
  • Bu nedenle Cursor açısından bir güç kullanıcısı için aylık 5 bin dolarlık maliyet oluşabiliyor
    • Buna karşılık Anthropic’in gerçek maliyeti yaklaşık 500 dolar seviyesinde
  • Cursor, geliştiricilerin Anthropic modellerini tercih etmesi nedeniyle zorlanıyor

Anthropic’in gelir yapısı ve yanlış algı

  • Anthropic, eğitim maliyetleri, personel giderleri ve büyük ölçekli hesaplama yatırımları nedeniyle genel olarak hâlâ zarar eden bir yapıda
  • Ancak token bazlı çıkarım (inference) maliyetinin yüksek olasılıkla kârlı olduğu düşünülüyor
  • “Yapay zeka çıkarımı zarar eden bir iş” algısı, API fiyatlarındaki aşırı marjı meşrulaştırıyor ve rekabeti zayıflatıyor
  • Gerçek çıkarım ekonomisini anlamak için OpenRouter’daki açık model fiyatlarına bakmak daha gerçekçi
    • Bunlar, büyük yapay zeka şirketlerinin API ücretlerine kıyasla gerçek maliyetin yalnızca bir kısmı düzeyinde kalıyor

1 yorum

 
GN⁺ 2026-03-11
Hacker News görüşleri
  • Qwen 3.5 397B-A17B'yi Anthropic modelleriyle karşılaştırmak saçma bir kıyaslama
    Qwen ve DeepSeek gibi Çin modellerinin Anthropic'ten 10 kattan fazla daha verimli olduğu söyleniyor
    OpenRouter fiyatlarıyla resmî sağlayıcı fiyatları arasında büyük fark olmamasının nedeni de bu. Üstelik OpenRouter sağlayıcılarının hangi quantization yöntemlerini kullandığı da belirsiz. Gerçekte 100 kat verim sağlıyor olmaları bile mümkün
    Elbette tüm kullanıcılar planı son sınırına kadar kullanmadığı için, kullanıcı başına 5.000 dolar zarar edilmiyor

    • Bu döngüsel bir mantık. Çin modelinin 10 kat daha verimli olduğuna inanılmasının tek nedeni 10 kat ucuz olması
      Amazon Bedrock'taki Opus 4.5 ile Çin modellerinin t/s değerlerine bakınca benzer düzeyde oldukları görülüyor; dolayısıyla gerçek aktif parametre sayısı da benzer
      OpenRouter'da BF16 veya Q8 sağlayıcılarını doğrudan seçmek de mümkün
    • Katılıyorum ama Opus 4.6'nın 10 kat daha büyük bir model olma ihtimali yüksek. GPT-4 zaten 1.6T bir modeldi ve Llama 4 de çok daha büyük
      Çinli şirketler GPU kıtlığı yaşıyor ama çıkarım verimliliği konusunda çok yenilik yaptılar. DeepSeek CEO'su Liang da bu konudaki makalelerin yazarları arasında
    • Qwen gibi açık kaynak modelleri Anthropic ile karşılaştırmak anlamsız
      Anthropic model mimarisini ya da parametre sayısını hiç açıklamadı
      Açık kaynak modellerin çoğu başka modellerden distill edilir ya da hesaplama maliyetini düşürmek için MoE kullanır
      Qwen'i kıyas ölçütü alan blog yazısına güvenmek zor
    • Opus, TPU kullanarak daha düşük maliyete ulaşmış olabilir
    • OpenRouter sağlayıcı bölümünde quantization bilgisi gösteriliyor
  • Asıl makaleye göre Cursor, geçen yıl aylık 200 dolarlık Claude Code aboneliğinin en fazla 2.000 dolarlık işlem gücü kullandığını tahmin etmişti
    Şimdi bu sübvansiyon daha da büyümüş durumda; aynı planın yaklaşık 5.000 dolarlık işlem tüketebildiği söyleniyor

    • Buna gelen tepki: "Bu her şeyi değiştiren bir bilgi"
  • Pek çok kişi OpenAI ve Anthropic'in token'ları zararına sattığına inanıyor ama buna dair gerçek kanıt neredeyse yok
    Bu meme, Forbes'taki hatalı bir yazı yüzünden yayıldı. O yazı API maliyeti ile işlem maliyeti arasındaki farkı bile anlamıyordu

    • Ama gerçekte zararına satış olduğuna dair kanıt yok diye kesin konuşmak da zor
      Anthropic'in CC dışı kullanımı engellemesi ve API harcama limitinin 5.000 dolar olması gibi işaretler, kârlılığın düşük olabileceğini düşündürüyor
    • "Sadece token satan bir şirket nasıl zarar etmez ki" diyenler de var
      Araştırma, eğitim ve altyapı personel maliyetlerinin hepsi token üretim maliyetine dahil edilmeli
      Açık ağırlıklı modellerin düşük fiyatı, pazar payı kazanmak için yapılan dampingden kaynaklanıyor; gerçek maliyet daha yüksek
      Sonuçta bu yapı uzun süre sürdürülebilir olmayacak
    • Anthropic'in token başına zarar edip etmediğinden çok, eğitim maliyetinin ne kadar olduğu daha önemli
      Model sürekli eğitilmezse token'ın değeri düşer
    • İlgili belgeler burada
  • Ekibimiz Claude Code'u API üzerinden kullansaydı aylık 200 bin dolar öderdik ama gerçekte Max abonelikleriyle ayda sadece 1.400 dolar veriyoruz
    Kullanıcı başına 50 bin dolar seviyesinde görünüyor ama JSON token sayılarına bakılırsa bunun çoğu önbelleğe alınmış istekler, yani gerçek maliyet muhtemelen çok daha düşük

    • Bunu hangi işleri bu kadar verimli dağıtarak yaptıklarını merak ediyorum. Ben de Claude'u çok kullanıyorum ama limite çabuk ulaşıyorum
    • Gemini CLI oturum başına önbellek tasarruf oranını gösteriyor; genelde %90 civarında
    • Ben de birden fazla Claude agent çalıştırıyorum; giriş token'larının %85'i önbellek okuması
      Gerçek maliyet muhtemelen 25 bin ila 30 bin dolar aralığında. Forbes'un 5 bin dolarlık tahmini abartılı
    • npx ccusage ile yerel loglara bakıp API bazlı maliyeti hesaplayabilirsiniz
    • Ama Max planını şirket amaçlı kullanmak kullanım şartlarını ihlal etmek olmuyor mu, bunu merak ediyorum
  • Anthropic'in işlem kapasitesi tamamen doluysa, Claude Code'un yoğun kullanıcıları kullanıcı başına 5.000 dolarlık bir fırsat maliyeti yaratabilir
    Ama bu kıyas, Rolex ile markasız bir saatin dişli sayısını karşılaştırmak kadar uygunsuz

    • Fırsat maliyeti gerçek maliyet değildir. Asıl mesele Anthropic'in abonelik satamayacak kadar dolu olup olmadığı
    • GPU çiftliği ne kadar tam kullanılırsa, batching etkisi sayesinde birim maliyet o kadar düşer
    • Eğlence sektöründe de "fırsat maliyeti" ifadesi sık kullanılır ama gerçekte olan şey çoğunlukla tüketimin düşmesidir
      Anthropic için de benzer şekilde, kullanıcıların belirsiz kaliteye şüpheyle yaklaşması ya da API tabanlı ücretlendirmeye geçmesi daha olası
    • "100 dolarlık abonelikle Opus'u bol bol kullandığım bu düzenin sürmesini diliyorum" diye şaka yapanlar da var
  • Çıkarım maliyeti ve kâr marjı, açık ağırlıklı modellerle büyük bulut sağlayıcıları arasında ciddi biçimde farklı
    Bu durum, ilaç sektöründeki Ar-Ge maliyeti ile jenerik üretim maliyeti farkına benziyor
    OpenAI'nin çıkarım marjının yaklaşık %70, Anthropic'in ise %40 ila %90 aralığında olduğu tahmin ediliyor
    İlgili yazılar: Phemex, SaaStr, The Information, Investing.com

    • "Kâr" kelimesini fazla rahat kullanmayalım diyenler var
      Muhasebe açısından bakıldığında model başına gelir eğitim maliyetini zaten karşılamış olabilir
      Ancak nakit akışı açısından şirket hâlâ cashflow positive değil
      Bu fark anlaşılmazsa yapay zeka sektörünün geneli olduğundan küçük görülür
  • Opus 4.6'nın model boyutunun ne olduğu konusunda emin değilim
    Qwen397B'den çok daha büyük olduğunu tahmin ediyorum

    • Musk'ın Grok'un trilyonlarca parametreye sahip olduğunu söylemesine bakılırsa, Opus da o seviyede olabilir
      Anthropic API'den para kazanıyor olabilir ama %90 marj seviyesinde değildir muhtemelen
    • OpenRouter'da DeepSeek v3.2 (685B/37B active) $0.26/0.40, Kimi K2.5 (1T/32B active) ise $0.45/2.25 olarak fiyatlanmış
    • Uzman biri tahminde bulunsa Opus'un 1 ila 2 trilyon parametre civarında olduğunu söylerdi
  • Önbellek neredeyse bedava gibi, ama gerçekte tamamen ücretsiz değil
    Önbellek token maliyetini çıkarınca 200 dolarlık aboneliğin gerçek işlem kullanımı yaklaşık 800 dolara düşüyor
    İşlem kapasitesinin büyük kısmı muhtemelen boşta duruyor

    • Ama önbellek RAM'i sürekli işgal ettiği için tamamen ücretsiz sayılmaz
      Önbellek isabet etmezse bu kez fırsat maliyeti oluşur
    • Önbellek sayesinde daha fazla kullanıcıya premium fiyatla çıkarım satılabildiği için, aslında geliri maksimize etme aracı işlevi görüyor
    • Eğer bu gerçekten boşta duran işlem değilse, o kaynaklar model eğitimi ya da araştırma deneyleri için de kullanılabilir
  • Cursor, Anthropic'in perakende API fiyatı üzerinden Opus 4.6 kullanmak zorunda olduğu için, yoğun kullanıcı başına ayda 5.000 dolar maliyet oluşabilir
    Buna karşılık Anthropic'in gerçek maliyeti muhtemelen 500 dolar düzeyindedir
    Yakın zamanda Swix podcast'inde Cursor'un bulut agent stratejisini dinledim; giriş engelleri düşüyor

  • Claude aboneliği spot instance kavramına daha yakın
    API ise on-demand hizmet ve öncelik API tarafında
    Boşta kalan işlem gücü abonelere ayrılıyor; kapasite yetersizse quantized düşük maliyetli modellere yönlendirme yapılıyor
    Bu tür abonelikler atıl kaynakları değerlendiriyor ve öngörülebilir iş akışlarıyla model eğitiminin kalitesini artırmaya da yardımcı oluyor
    Qwen Code, Codex ve Claude'un üçünü de kullandım; Codex, Qwen'den 2 kat, Claude ise Codex'ten 2 kat daha iyiydi
    Bu yüzden Claude Opus'un Qwen Code'dan 4 ila 5 kat daha pahalı olacağını düşünüyorum

    • "Claude, Codex'ten 2 kat daha iyi" kısmı artık doğru değil
    • "Kapasite yetersiz kalınca düşük maliyetli modele yönlendiriliyor" kısmı resmî olarak hiç açıklanmadı