16 puan yazan GN⁺ 2025-07-26 | 1 yorum | WhatsApp'ta paylaş
  • Çeşitli LLM sağlayıcılarının (ör. OpenAI, Anthropic, Google) fiyatlarını eşdeğer bir ölçütle (token başına fiyat) açıkça karşılaştırmayı mümkün kılar
    • Sağlayıcı, model, Input ($/M), Output ($/M) biçiminde tablo ve grafik desteği sunar
  • Son veri güncelleme zamanı: 26 Temmuz 2025
  • Belirli bir modeli seçmeden önce, maliyet/performans analizi için başvurulabilecek temel veriler sağlar
  • Bültene abone olarak güncel bilgileri düzenli olarak alabilirsiniz

1 yorum

 
GN⁺ 2025-07-26
Hacker News görüşleri
  • (OpenRouter'da çalışıyorum) Bu sorunu çözmek için fiyat ve model bilgilerini API üzerinden sağlayan tedarikçilerle birlikte çalıştık; bu sayede marketplace'teki bilgileri her zaman güncel tutabiliyoruz. 1 yıl önce bunları Slack kanalında konuşarak paylaştığımız günleri hatırlıyorum. Son dönemde ise her tedarikçide prompt uzunluğu, cache'leme gibi çeşitli etkenler nedeniyle token fiyatlandırma sistemi çok karmaşık hale geldi. Aslında önemli nokta model bazında değil, endpoint bazında token başı fiyat. Örneğin hızlı/yavaş sürümler, thinking/non-thinking gibi durumlarda aynı model olsa bile endpoint'e göre fiyat sık sık değişebiliyor. Tüm bu süreci çözmek için çok emek harcadık ve mevcut sonuç şu anda OpenRouter'da açık durumda (henüz fiyat odaklı, kolay okunur bir formatta düzenlenmediğini kabul ediyorum)
    • Hemen şimdi bunu daha kısa ve daha kolay görüntülenebilir hale getirmeyi denedim, emek için gerçekten teşekkürler, llm-pricing projesini paylaşıyorum
  • Verinin hatalı olup olmadığını merak ediyorum, Google Gemini 2.5 Flash-Lite için input token başına fiyat $0.10 ama burada $0.40 olarak görünüyor gibi. Resmi fiyat tablosuna bakınız
    • Veri yanlış değil, galiba ben tabloyu yanlış okudum, (düzeltme: sanırım yanlış yanıt verdim, öyle cevap vermem iyi olmadı)
  • Bu bilgi harika, ancak pratikte UX açısından daha çok şey düşünmek gerekiyor
    • Aynı model için bile tedarikçiye göre fiyat değişiyor
    • Her tedarikçi hız, maliyet vb. farklı ölçütler için optimize oluyor
    • Aynı modelin farklı quantization sürümleri bulunabiliyor
    • Grok API gibi toplu(batch) fiyatlama sunan yerler de var
    • “thinking/non-thinking”, multimodal olup olmaması gibi ayrıca filtrelenebilecek çok sayıda koşul var
    • Benchmark puanları da ayrı bir değişken
      artificialanalysis.ai gibi blended cost (girdi/çıktı birleşik ücret) sunan kaynaklar bir ölçüde yardımcı oluyor, ama gerçekte kullanım amacına göre Input/Output ücret modeli de sürekli değişebiliyor. Gerçekten iyi bir karşılaştırma arayüzüne sahip bir sitenin çıkmasını bekliyorum; keşke biri bunu bir gün mutlaka yapsa
    • (OpenRouter'da çalışıyorum) Aslında sitede pek belli olmuyor ama çok basit bir model karşılaştırma aracı var, örnek için: OpenRouter model karşılaştırma sayfasına bakınız
    • Tabloda “provider” adlı, yani API çağrısının gerçekten nereye gittiğini gösteren bir sütun eklemek bu sorunu çözebilir mi diye merak ediyorum
    • Adil bir karşılaştırma yapmak çok zor görünüyor. En iyi yaklaşım, her koşuldaki trade-off'ları açıkça gösterip kullanıcının kendisinin karar vermesini sağlamak olur. Token exchange gibi, kullanıcıların ihtiyaçlarını yazdığı ve şirketlerin buna uygun hizmetleri rekabetçi biçimde sunduğu bir platform fikri de ilginç. Herkesin kendi hesaplama gücünü paylaştığı bir marketplace de hayal edilebilir, ama gerçek performansı olduğundan iyi gösterme ya da veri sızdırma gibi sorunlar için ayrıca çözüm gerekir
    • Lütfen benchmark sıralamalarına artık bu kadar önem vermeyelim, insanları aşırı biçimde böyle karşılaştırmalara odaklayan ortamın sürmesi üzücü
  • Eskiden yeni çıkan bir modelin ücretini bulmak için sayısız tanıtım sayfası arasında dolaşmak çok sinir bozucuydu, şimdi OpenRouter'da hepsini tek bakışta görebilmek kullanışlı
  • Asıl sorun, token'ın tedarikçi/model bazında farklı olması. Bu sadece tokenizer modeli meselesi değil; aynı şirket içinde bile çok büyük farklar var
    • Örneğin image input durumunda gpt-4o-mini, gpt-4'e kıyasla 10 kat daha fazla token tüketiyor
    • gemini 2.5 pro'nun output'u genelde token bazında ücretlendiriliyor, ancak structured output kullanıldığında her karakter bir token sayılıyor
    • Token başı fiyat bilgisi önemli olsa da, gerçekte asıl ihtiyaç aynı sorgu/yanıtın farklı modellerde ne kadara mal olduğunu bilmek; çünkü tüm token'lar aynı değil
    • Her gün aynı deneyi çalıştırıp maliyeti tabloda bir sütun olarak eklemeyi planlıyorum. Örneğin tüm modellere aynı "Bu makaleyi 200 kelimede özetle" prompt'unu verip sonucu ölçebiliriz
    • gemini 2.5 pro'da structured output kullanınca karakter=token yaklaşımı denmesiyle ilgili daha fazla bilgi duymak isterim, farkın ne olduğunu pek anlamadım
  • Şu anda site kapalı ama Simon Willison'ın LLM fiyat hesaplayıcısını da önermek isterim (llm-prices.com)
  • Donanım için yaklaşık $2500 bütçeyle hangi modelleri yerelde çalıştırabileceğimi merak ediyorum. Yetmiyorsa ne kadar bütçe gerektiğini ve yerelde kendi başına çalıştırmaya dair öğreticiler varsa paylaşılmasını isterim
    • Yerel LLM kullanımına ilginiz varsa başlangıç noktası ollama.com. Parametre sayısını RAM kapasitesine (GB) kabaca çevirebilirsiniz; örneğin Deepseek-r1:7b modeli yaklaşık 7GB gerektirir. Context window büyüdükçe daha fazla bellek gerekir. $2500 bütçeyle bir yapay zeka cihazı kuracaksanız LPDDR5 gibi bol unified memory içeren bir yapı öneririm. Referans bağlantı: Framework AIMax300
    • 18 ay önce $1900 verip 32GB Mac Mini M2Pro aldım ve quantized 40B yerel modellere kadar gayet iyi çalıştırıyor. Yerel model performansı yetersiz kalırsa Gemini 2.5 flash/pro ile gemini-cli kombinasyonunu da kullanıyorum. Ticari API'ler de yerel modeller de iyi seçenekler sunuyor; en iyisi birini seçip hızlıca kurulum ve geliştirme işine odaklanmak
    • Yaklaşık $600'a ikinci el iki adet 3090 ekran kartı almak en iyisi. 3090 hâlâ fiyat/performans açısından çok güçlü
    • Kimi ve deepseek, büyük bulut sağlayıcılarıyla kıyaslandığında performans farkı çok açılmayan az sayıdaki modelden ikisi
    • ollama ekosistemindeki modeller için iyi bir CPU'nuz varsa bazı modeller sorunsuz çalışabiliyor
  • Tedarikçi bazlı fiyat bilgisi için tek seçenek her sitenin ayrı ayrı dolaşılmasıydı; OpenRouter iyi bir alternatif. Açık modelleri de birlikte listeliyor ve modelin gerçek fiyatı/ölçeği ile şu anda kabaca ne kadar sübvanse edildiğini görmeye yardımcı oluyor
    • OpenRouter API'de model ve fiyat bilgisi sorgulanabilen bir endpoint var (OpenRouter model API dokümanı). Dezavantajı, model başına yalnızca tek bir tedarikçi bilgisi vermesi. Ticari modeller için bu büyük sorun değil, ama açık kaynak modellerde tedarikçiye göre fiyat farkı 5-10 kata kadar çıkabildiği için yalnızca referans olarak kullanılmalı
  • Fiyat verileriyle genel benchmark bilgilerini birleştirip “fiyat/performans (benchmark puanı / token maliyeti)” açısından en iyi modelin hangisi olduğunu gösteren bir kaynak olsa güzel olurdu
  • Her tedarikçinin fiyat politikası basit input/output ücretlendirmesinden çok daha karmaşık
    • DeepSeek'in yoğun olmayan saat ücretlendirmesi
    • OpenAI/Anthropic'in batch fiyatlandırması
    • Google/Grok'un context window'a göre fiyatlandırması
    • Qwen'in thinking/non-thinking token'larını ayrı ücretlendirmesi
    • Qwen coder'ın input token tier fiyatlandırması
      İlgili gönderi için: X.com paradite_