- Ajan tarzı kullanım örüntülerinde, abonelik modeli 36 kat daha yüksek fiyat/performans sunuyor
- ‘Max 5x’ planı, oturum limiti için 6 kat, haftalık limit için 8,3 kat kapasite sunarak pazarlamada verilen değerden daha fazlasının fiilen kullanılabildiğini gösteriyor
- ‘Max 20x’ planı yalnızca 5 saatlik oturum bazında 20 kat ölçekleniyor; haftalık limit ise Max 5x’in yaklaşık 2 katı ile sınırlı kalıyor
- Web arayüzünde önbelleğe alınmış bağlamı yeniden kullanmanın maliyeti 0 iken, API’de aynı bağlam yeniden gönderildiğinde girdi maliyetinin %10’u tekrar ücretlendiriliyor
- Abonelik limitleri, kayan noktalı kullanım oranı değerlerinin tersten hesaplanmasıyla geri çıkarılarak iç kredi ve token yapısı hassas biçimde analiz ediliyor
Analizin arka planı ve yaklaşım
- Claude web arayüzünde görünen alışılmadık derecede hassas kullanım oranı ondalıkları, iç hesaplama sonuçlarına işaret ediyor
0.16327272727272726gibi değerlerin kesir tabanlı bir iç kredi sisteminden geldiği tahmin ediliyor- Bu değerleri kesir biçiminde tersten hesaplamak için Stern–Brocot tree kullanılıyor
- Böylece gerçek oturum limitleri, haftalık limitler ve kredi birimleri yeniden elde edilebiliyor
Web aboneliği ile API maliyet yapısı arasındaki fark
- Claude web aboneliğinde aynı konuşma bağlamına tekrar tekrar başvurulsa bile ek girdi maliyeti oluşmuyor
- API’de ise aynı bağlamın her istekte yeniden gönderilmesi gerekiyor ve önbellek isabeti olsa bile girdi token maliyetinin %10’u alınıyor
- Ajan tarzı kodlama gibi uzun bağlamı tekrar tekrar tüketen kullanım örüntülerinde maliyet farkı hızla büyüyor
‘Max 20x’ planının gerçek sınırları
- ‘20x’ ifadesi yalnızca 5 saatlik oturum başına kullanım miktarı için geçerli
- Haftalık kümülatif kullanım limiti Max 5x’in yaklaşık 2 katı ile sınırlı
- Kısa sürede çok yoğun kullanım için avantajlı olsa da uzun süreli kesintisiz kullanımda verim düşüyor
‘Max 5x’ planının gerçek verimliliği
- Oturum limiti, Pro’ya göre yaklaşık 6 kat genişliyor
- Haftalık limit, Pro’ya göre yaklaşık 8,3 kat artıyor
- Adından daha fazla gerçek kapasite sunan bir plan olduğu görülüyor
- Aylık 100 dolar düzeyinde API’ye kıyasla ezici bir maliyet verimliliği oluşuyor
Maliyet verimliliği sonucu
- Uzun süreli kodlama, Claude Code gibi ajan tabanlı geliştirme işleri için abonelik API’ye göre çok daha avantajlı
- Özellikle ‘Max 5x’ planı, hız, süreklilik ve maliyet dengesi açısından en iyi noktayı sunuyor
- Mevcut yapı baz alındığında ileri düzey kullanıcılar ve geliştiriciler için en iyi seçenek durumunda
Orijinal yazı bağlantısı: suspiciously precise floats, or, how I got Claude's real limits
Reddit yorumlarının özeti
- Yorumların genelinde, OP’nin sayısal analizinin hesaplama açısından geçerli olduğu konusunda güçlü bir fikir birliği var
- Özellikle aylık 100 dolarlık ‘Max 5x’ planının ağır kullanıcılar için en iyi fiyat/performansı sunduğu görüşünde uzlaşma sağlanıyor
- Web arayüzünde bağlam önbelleğini yeniden kullanmanın ücretsiz olması sayesinde, uzun süreli ve ajan tarzı oturumlarda API ile aradaki maliyet farkı çok büyüyor
- Gerçek Max 5x kullanıcıları arasında da tüm gün kullansalar bile limite neredeyse hiç ulaşmadıklarını söyleyen çok sayıda deneyim paylaşılıyor
- ‘Max 20x bir tuzak’ iddiasına ise ek açıklamalar getiriliyor
- Haftalık toplam kullanım limiti, Max 5x’in yalnızca 2 katı düzeyinde kalıyor
- Buna karşılık 5 saatlik oturum limiti 4 kat daha genişliyor
- Buna göre 20x kısa süreli patlayıcı kullanım için (sprint), 5x ise uzun süreli sürekli kullanım için (maraton) şeklinde bir rol ayrımı ortaya konuyor
- En güçlü uyarı ise Anthropic’in şeffaflık eksikliği konusunda yapılıyor
- Bu analiz tamamen tersten hesaplanan verilere dayanıyor
- İç limitler haber verilmeden değiştirilebilir
- Kısa vadeli maliyet optimizasyonu için yararlı olsa da uzun vadeli iş kararlarının temeli olarak kullanmanın riskli olduğu yönünde ortak bir görüş oluşuyor
- Pratikte en faydalı ipucu olarak Claude Code VS Code eklentisinin kullanım şekli öne çıkıyor
- API anahtarı yerine claude.ai abonelik hesabıyla giriş yapılabiliyor
- Böylece API kredisi harcamadan abonelik limitleri kullanılabiliyor
- Bu bilgiyi ilk kez öğrendiğini söyleyen çok sayıda kullanıcı var
- Ek bir tartışma başlığı olarak gizlilik ve kullanım şartları farkı da anılıyor
- Web arayüzü ile API’nin Terms of Service metinleri farklı
- Hassas ya da özel mülkiyet niteliğindeki kod çalışmaları için API kullanımının daha güvenli olduğu düşünülüyor
- Karşıt görüş olarak, kullanım limitlerinin verimliliği artırdığı savı da dikkat çekiyor
- Sınırsıza yaklaştıkça prompt’lar uzayıp verimsizleşmeye daha yatkın oluyor
- Limitlerin, prompt tasarımını daha rafine ve daha kasıtlı hale getirmeye zorladığı değerlendirmesi yapılıyor
- Genel olarak yorumların havası
- “Şu an için en iyi tercih Max 5x” yönünde pratik bir uzlaşı
- Aynı anda “bu yapı her an değişebilir” şeklinde bir temkinlilik de içeriyor
2 yorum
8 agenti açık çalıştırınca limit hemen doluyordu
Bu, senin çok fazla kullanmıyor olmandan kaynaklanıyor.... ritme kapılıp gidersen 20 katı da anında eritir~