1 puan yazan GN⁺ 4 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • DeepSeek-V4-Pro API fiyatı, %75 indirim promosyonu sona erdikten sonra da resmi olarak önceki fiyatın 1/4 seviyesinde kalacak
  • Ücretlendirme, 1 milyon token başına fiyat üzerinden yapılıyor ve girdi tokenları ile çıktı tokenları kullanımına göre bakiyeden doğrudan düşülüyor
  • Desteklenen modeller DeepSeek-V4-Flash ve DeepSeek-V4-Pro; her ikisi de düşünmesiz mod ile düşünme modunu destekliyor ve varsayılan ayar düşünme modu
  • Her iki modelde de bağlam uzunluğu 1M, azami çıktı 384K; eşzamanlılık sınırı ise Flash için 2500, Pro için 500
  • Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi ve bu düzenleme 26 Nisan 2026 12:15 UTC'den itibaren geçerli

Ücretlendirme ölçütü

  • Fiyat birimi, 1 milyon token başına ücrettir; token, modelin tanıdığı en küçük metin birimidir ve kelime, sayı ya da noktalama işareti olabilir
  • Faturalandırma ölçütü, modelin toplam girdi tokenı ve çıktı tokenıdır
  • Maliyet, token sayısı × fiyat şeklinde hesaplanır ve yüklenen bakiyeden veya ödeme bakiyesinden doğrudan düşülür
  • Hem yükleme bakiyesi hem de ödeme bakiyesi varsa önce ödeme bakiyesi kullanılır
  • Ürün fiyatları değişebilir ve DeepSeek fiyat ayarlama hakkını saklı tutar
  • Gerçek kullanım miktarına göre bakiye yüklenmesi ve güncel fiyatların ilgili sayfadan düzenli olarak kontrol edilmesi önerilir

Modeller ve fiyatlar

  • Desteklenen modeller

    • DeepSeek-V4-Flash ve DeepSeek-V4-Pro sunuluyor
    • Her iki model de düşünmesiz mod ile düşünme modunu destekliyor; varsayılan ayar düşünme modu
    • deepseek-chat ve deepseek-reasoner model adları gelecekte kullanımdan kaldırılacak
    • Uyumluluk için deepseek-chat, deepseek-v4-flash modelinin düşünmesiz moduna; deepseek-reasoner ise deepseek-v4-flash modelinin düşünme moduna karşılık gelir
  • Uç noktalar ve özellikler

  • Bağlam ve çıktı sınırı

    • Bağlam uzunluğu 1M
    • Azami çıktı 384K

1 milyon token başına fiyat

Kalem DeepSeek-V4-Flash DeepSeek-V4-Pro
Girdi tokenı, önbellek isabeti $0.0028 $0.003625
Girdi tokenı, önbellek kaçırması $0.14 $0.435
Çıktı tokenı $0.28 $0.87
Eşzamanlılık sınırı 2500 500
  • DeepSeek-V4-Pro indirim düzenlemesi

    • DeepSeek-V4-Pro fiyatı %75 indirimli fiyat olarak gösteriliyor
    • Önbellek isabetli girdi tokenı fiyatı önceki $0.0145 seviyesinden $0.003625'e indirildi
    • Önbellek kaçırmalı girdi tokenı fiyatı önceki $1.74 seviyesinden $0.435'e indirildi
    • Çıktı tokenı fiyatı önceki $3.48 seviyesinden $0.87'ye indirildi
    • %75 indirim promosyonu 31 Mayıs 2026 15:59 UTC'de sona erdikten sonra da DeepSeek-V4-Pro API fiyatı resmi olarak önceki fiyatın 1/4 seviyesine ayarlandı
  • Önbellek isabet fiyatında indirim

    • Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi
    • Bu fiyat düzenlemesi 26 Nisan 2026 12:15 UTC'den itibaren geçerli
  • Eşzamanlılık sınırı

    • DeepSeek-V4-Flash için eşzamanlılık sınırı 2500
    • DeepSeek-V4-Pro için eşzamanlılık sınırı 500
    • Eşzamanlılık sınırının ayrıntıları Rate Limit & Isolation sayfasında görülebilir

1 yorum

 
GN⁺ 4 시간 전
Hacker News yorumları
  • Kendi kodlama ajanını çıkarırsa DeepSeek modellerini ana seçenek olarak kullanmaya başlayabilirim
    Modeli açık kaynak yapma, araştırma yayımlama ve düşük fiyatı koruma gibi konularda sürekli “doğru yönde” ilerliyor gibi görünüyor

    • Claude Code içinde V4 Pro kullanılabiliyor 1
      Bizzat denedim, etkileyiciydi

    • OpenCode ile de çok iyi çalışıyor
      Ekibimiz başka bir abonelik hizmetindeki 5 saat sınırına sık sık takılıyor; yedek olarak DeepSeek bulundurmak oldukça iyi oluyor
      Sadece 50 dolar yükledim ama sanki hiç bitmeyecekmiş gibi geliyor

      Henüz en ileri modellerin yerini tamamen alacak seviyede değil ama yedek olarak kesinlikle harika

    • DeepSeek’in illa kendi kodlama ajanını da sunması gerektiğini sanmıyorum
      Modeli alıp mevcut herhangi bir kodlama ajanına bağlamak yeterli
      Ben şahsen Pi tercih ediyorum ama herkes kendine uygun olanı kullanabilir

    • Bu haftanın başından beri kendi kod tabanımda Çin modellerini test etmeye başladım
      Şimdilik daha çok sohbetli kodlamadan ziyade issue sınıflandırma, otomatik hata düzeltme ve log analizi gibi şeylere baktım; DeepSeek, Kimi, GLM, Qwen ve MiMO’yu GPT-5.5 high ile karşılaştırdım ve hepsini Pi harness üzerinde kurulum gerektirmeden çalıştırdım

      Şu ana kadar Kimi ve MiMO en umut verici görünenler
      Yeterince sıkı test etmiş değilim ama ilk izlenimim, günlük iş akışındaki genel görevlerde bu modellerin insanların düşündüğü kadar geride olmayabileceği yönünde

      Yine de “akıllıca çalışmaktan çok çok çalışmaya” daha yakınlar; benzer sonuca daha yavaş ulaşıyor ve daha fazla token harcıyorlar ama fiyatları çok daha düşük

    • Kodlama ajanlarının model sağlayıcısından bir ölçüde bağımsız olması daha iyi olur
      Sağlayıcılar kaliteyi, özellikleri ve fiyatları çok sık değiştiriyor; her seferinde ajanı da değiştirmek istemem

      Ortamın biraz yavaşlayıp oturmasını umuyorum
      Bunun hemen şimdi olması gerektiğini söylemiyorum ama o noktaya gelmek güzel olurdu

  • DeepSeek V4’ü hâlâ denemediyseniz ciddi şeyler kaçırıyorsunuz
    Fiyatına göre inanması zor derecede iyi

    DeepSeek’in düşünce zincirini okumak gerçekten çok ilginç
    OpenCode bunu göstermiyor ama kendiniz okuyunca bu modelin ne kadar az takdir edildiğine şaşırabilirsiniz

    Model kullanımım çok düşük olsa da, modeli açık kaynak yapmalarına duyduğum minnet ve bunu genel olarak toplumsal fayda olarak görmem nedeniyle DeepSeek’e düzenli olarak doğrudan para ödüyorum

    • İyi ve ucuz ama siyaset açıldığında sansür kuralları gibi şeyler devreye girebiliyor
      Düşünce sürecini izlerken bir anda her şeyi silip hiçbir açıklama yapmadan başka bir konuya geçmeyi önerdiğine tanık oldum
      Bir keresinde de haber medyasının halka hizmet etmesi gerektiği tarzında genel geçer bir mesaj üretti

      İki durumda da talep hassas değildi, yasa dışı ya da rejim karşıtı da değildi; bu yüzden şaşırdım
      Ama konu azıcık politikti ve bu yetti
      Batı’daki sansür genelde daha incelikli olduğu için bu hem ürkütücü hem de tuhaf biçimde taze geldi

    • Evet, model gerçekten çok iyi
      İşte Claude kullanıyorum, kişisel kullanımda DeepSeek kullanıyorum; beni aktif olarak iflas ettirmeye çalışmayan tek model bu

    • Bazı görevlerde V4 Pro’yu seviyorum ama kodlamada V4 Flash epey etkileyiciydi
      Kısa ve öz, hedefi iyi tutturuyor, daha az hata yapıyor ve oldukça hızlı

    • opencode CLI’da akıl yürütme izleri görünüyor
      Belki bir ayar sorunudur

    • opencode içinde akıl yürütme gösterimini açıp kapatabiliyorsun

  • Bu fiyat şüphe uyandıracak kadar ucuz
    Aynı model başka sağlayıcılarda host edilince çok daha pahalı 0
    O yüzden ya DeepSeek bunu başkalarından çok daha ucuza host edebiliyor ya da iş modeli farklı; bence ikincisi
    Özellikle gizlilik politikasında 1, “User Input” dahil kişisel verileri “hizmeti iyileştirme ve geliştirme, teknoloji eğitimi ve iyileştirmesi” için kullanabileceklerini söyledikleri için

    • Belki aptalca bir soru ama OpenRouter’a bakınca DeepSeek sağlayanların gerçekten sadece ABD, Singapur ve Çin dışında olmadığı mı sonucu çıkıyor?
      Avrupa’da ya da başka Batılı sağlayıcılarda sunulmak için fazla bariz bir fırsat gibi duruyor
      Bunun Mistral’dan çok daha büyük bir sıçrama olduğuna eminim

      Bu modelleri kullanmak istiyorum ama standart hukuki gerekliliklerin ötesinde verilerimle eğitim yapan veya onları saklayan sağlayıcılardan kaçınmak istiyorum

    • Birden fazla etken birlikte rol oynuyor
      Inference stack verimliliği açısından birçok sağlayıcı hazır sglang / vllm / trtllm alıp en iyisini umuyor ama DeepSeek ekibi optimizasyon sınırlarını zorlamasıyla biliniyor

      sglang ve vllm mükemmel yazılımlar ama DeepSeek’in seyrek attention yaklaşımı olan DSA’ya bakarsanız bunun 1,5 yıl önce getirildiğini görürsünüz (https://arxiv.org/abs/2512.02556) ve DeepSeek 3.2, GLM 5, DeepSeek V4’te kullanıldı
      Ancak şimdi büyük inference motorlarında optimizasyonlar yavaş yavaş gelmeye başlıyor: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 vb.)
      Elbette DS V4, DSA’nın üstüne ek model mimarisi optimizasyonları da ekliyor ve açık kaynak inference motorlarının bundan tam yararlanması zaman alacak

      Gizlilik tarafında ise, insanların Çin dışındaki hosting için ek ücret ödeyeceği yönünde bir bahis var
      Özellikle de DeepSeek API verilerini model iyileştirmesinde kullandığını şeffaf biçimde söylediği için

      Bunların dışında ölçek var; MoE’de bu çok önemli, ayrıca güvenilirlik ve yumuşak kurumsal müşteri bağımlılığı gibi faktörler de var

      Ayrıca örtük danışıklı fiyatlandırma ihtimali de yüksek
      GLM 5 ile GLM 5.1 fiyatlarına bakarsanız çalıştırma maliyetleri aynı ama 5.1 çok daha iyi bir model; Z.AI da fiyatı yükselttiği için sağlayıcılar 5.1’i daha pahalı fiyatladı

    • Açıkça zararına satıyorlar
      E olsun, neden olmasın?
      Zarar ederek pazar payı kazanmak sadece ABD’ye özgü bir şey değil

    • DeepSeek’in kurucusu Liang Wenfeng hakkında yeterince bilgi sahibi olmayabilirsiniz
      Kendisi aynı zamanda High-Flyer Quant’ın da kurucusu

  • Ben daha çok cache tarafını merak ediyorum
    “Tüm modellerde input cache hit fiyatı lansman fiyatının 1/10’una düşürüldü ve bu fiyat ayarı 2026/4/26 12:15 UTC itibarıyla geçerli” deniyor

    Herhangi bir bitiş tarihi yok
    Şu anda DeepSeek V4 Flash, input fiyatının %2’si; bu V4 Pro fiyatıyla %0,8 ediyor ve rakiplere kıyasla aşırı düşük, hatta birim ekonomiyi etkileyecek kadar düşük olduğu için bunun geçici olduğunu sanmıştım

    V4 Pro için cache hesaba katıldığında gerçek maliyet input tarafında 1 milyon token başına yaklaşık $0.04 ediyor (OpenRouter metriklerine göre: https://openrouter.ai/deepseek/deepseek-v4-pro)
    Rakiplerin küçük modellerinden bile çok daha ucuz

    • DeepSeek V4’ün KV cache’i, güçlü biçimde sıkıştırılmış seyrek attention yapısı sayesinde çok verimli
      Yalnızca DSA kullanan DeepSeek V3.2 daha küçük bir model olmasına rağmen, 1 milyon context window’da DS V4 Pro’dan 10 kat fazla bellek kullanıyor

      Ayrıca DeepSeek API’nin cache hit oranı da çok iyi
      Aynı iş yükünde açık ağırlıklı modeller sunan büyük Batılı inference sağlayıcılarında KV cache hit oranı yaklaşık %50 iken DS API’de yaklaşık %80 görüyorum

    • DeepSeek V4’ün büyük olayı KV cache boyutunun ciddi ölçüde küçülmüş olması

    • Flash kendi başına çok rekabetçi bir model değil ve fiyatı da piyasadaki diğer modellerle benzer aralıkta
      Flash modelin en doğrudan rakipleri muhtemelen şunlar:

      GPT 5.4 mini

      Cache Read
      $0.075
      /M tokens

      Gemini 3 flash:

      Cache Read
      $0.05
      /M tokens

      Yani burada özel bir sihir ya da çığır açan bir durum yok

    • Sonnet:
      Cache Read
      $0.30

      Gemini 3.5 flash:
      Cache Read
      $0.15

  • Müthiş bir fiyat/performans
    Bir süredir GLM 5.1 ile GLM Coding Plan Max kullanıyordum ve DeepSeek V4 Pro’yu da yaklaşık 3 haftadır test ediyorum; karmaşık kodlama işlerinde GLM 5.1’den daha iyi olduğunu düşünüyorum
    65 milyon token kullandım, bu fiyatlarla 1,5 dolar tuttu; gerçekten çok ucuz

    • DeepSeek sanki diğer modellere göre çok daha fazla token tüketiyor
  • İnanılmaz
    Bu durumda DeepSeek V4 Pro, aynı kategorideki diğer modellere kıyasla aşırı ucuz kalıyor
    1 milyon output token başına fiyatlara bakarsak:

    DeepSeek V4 Pro: $0.87

    Qwen 3.7 Max: $7.50

    Grok 4.3: $2.50

    GLM 1.5: $3.08

    Opus 4.7: $25.00

    GPT-5.5: $30.00

    • Cache read maliyetini de katınca fiilen daha da ucuz
      Ajan iş akışlarında belirleyici maliyet bu olabilir ve DeepSeek’in cache read fiyatı karşılaştırılamayacak kadar düşük
      1 milyon token başına $0.003626, listedeki bundan sonraki en ucuz seçenek bile 1 milyon başına $0.2’nin üzerinde
      Neredeyse 100 kat fark var
    • Bir dahaki sefere biri “kullanım limitleri yüzünden sızlanma, aboneliğinle şirket zaten zarar ediyor” dediğinde bu yorumu paylaşacağım
      Yani mesele, insanların sınırsızca para yakmasına izin vermeden de inference’ı verimli yapabilmekmiş
    • Abone olduktan sonra modeli kötüleştirmiyorlar da
      Opus ne kadar iyi olursa olsun, iki ay sonra maliyet kısmak için onu GPT-3’ten kötü hale getireceklerse bunun bir anlamı yok
    • GLM 5.1
  • V4 Pro indirimi hesaba katılsa bile V4 Flash, dolar başına performansta en iyi seçenek; ajan tarzı ve yoğun araç kullanımı gerektiren işlerde genel performansı da daha iyi
    V4 Pro tek seferlik akıl yürütmede daha zeki ama hız farkı büyük
    Performans, maliyet ve hızı birlikte düşününce V4 Flash şu anda bizim ölçütlerimize göre açık ara en iyi flash model

    Veriler https://gertlabs.com/rankings adresinde

    • Benim kullanım senaryomda, çoğunlukla çok büyük özetleme ve fikir çıkarımı işlerinde Pro’ya kıyasla epey zayıf kaldı
  • Bu MLA mimarisi, standart attention’a kıyasla KV cache’i yaklaşık 5 ila 13 kat küçültüyor
    Dolayısıyla bu sadece pazar payı kazanmak için yürütülen bir fiyat savaşı değil; inference çalıştırma maliyetleri gerçekten daha düşük

    • Yerel inference için de oyun değiştirici
      Sıradan tüketici platformlarında uzun context, batch inference ve KV cache’in diske yazılması mümkün hale geliyor
    • Evet
      Bu indirim, yeni nesil modelde cache’lemenin ne kadar verimli çalıştığını doğrulamaya dönük bir lansman sonrası pazar deneyi olmuş olabilir
  • ABD’de host edilen modellere kıyasla Çin’de host edilen modellerde kazara veri sızıntısı konusunda daha çok endişeliyim
    Örneğin ajanın env dosyasını okuması gibi durumlar
    Çin hükümetinin tüm konuşmaları tarayıp işine yarayan bilgileri saklama olasılığının ABD hükümeti veya şirketlerinden daha yüksek olduğundan şüphelenmem yanlış mı?

    Bunun önyargılı ve yabancı düşmanı gibi duyulabileceğini düşündüğüm için bu yorumu yazarken bile tereddüt ettim
    Umarım biri beni yanlış düşündüğüme ikna eder
    DeepSeek hosting’inin arkasındaki şirketin nasıl bir yapısı olduğunu ya da veri gizliliğine saygı gösterme konusunda bir geçmişi olup olmadığını bilen var mı?

    • Bu mantıksız bir kaygı değil
      Zaten çoğu ABD şirketi bu yüzden AWS Bedrock ya da yapay zeka laboratuvarlarını tercih ediyor ve genelde veri saklamama sözleşmesi talep ediyor
      Ama bence sızıntı riski hosting nerede olursa olsun var; değişen şey teşvik yapısı

      Mesela laboratuvarlar da bütün konuşmaları tarıyor ve kurumsal ZDR sözleşmeleriyle korunmayan verilerle eğitim yapıyor
      Kolluk kuvvetleri, geçerli bir mahkeme kararıyla ya da acil durumlarda tüm kullanıcı verilerine erişim talep edebiliyor 1

      DeepSeek V4’ü gizli biçimde kullanmak istiyorsanız Tinfoil’i (tinfoil.sh) deneyebilirsiniz
      Tüm modelleri doğrulanabilir güvenli donanım enclave’lerinde host ederek inference’ı uçtan uca gizli hale getiriyor
      Açık olayım, kurucu ortaklardan biriyim

      1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...

    • Azure gibi bir şey üzerinden kullanabilirsiniz
      Tüm modeli host ediyor ve ABD’den sunuyor
      Bunun gibi başka sağlayıcılar da vardır

      Biz böyle kullanıyoruz ve gayet iyi çalışıyor

    • Bunu yapıyor olsalar şaşırmam
      ABD merkezli modellerin başka hükümetler adına aynısını yaptığını duysam da çok şaşırmam
      Veri gizliliği konusunda büyük beklentilerim yok
      Microsoft kurumsal tarafta tüm kutucukları işaretliyor olabilir ama Azure da bazen ihlal ediliyor

    • Bunun olma olasılığının sıfır olmadığını düşünüyorum
      Pekin herhangi bir anda DeepSeek’in fazla güçlü olduğuna ya da önemli bir ihracat ürünü haline geldiğine karar verip müdahale edebilir
      Hatta bunun zaten yapılmadığının garantisi de yok

      Çin’le sınırlı olmayan yabancı aktörlerin, ABD’de birçok sektörde kritik ağlara büyük çapta sızdığına ve uygun zamanı bekleyip bunları kötüye kullanacağına dair çok sayıda rapor var
      En gelişmiş modeller de bir başka saldırı vektörü ve düşününce kötüye kullanımı çok daha kolay olabilir

      Aslında bulutta host edilen her modelde bu ihtimal var
      İster modeli yapan şirket bunu bilerek yapsın ister kötü niyetli bir aktör bir açığı sömürsün

    • Çin’den birinin özellikle beni hedef alacak kadar önemli biri değilim
      Üstelik DeepSeek’in kullanıcıların platformu kullanmaya devam etmesi için yeterli güveni koruması gerekiyor
      Herkesin kripto cüzdanını hedef alan bir keylogger gibi davranırlarsa bu güven çöker

      Çin hükümetinin stratejik açıdan önemli göreceği bir iş yapıyor olsaydım elbette endişelenirdim ama ben öyle bir şey yapmıyorum

      Açıkçası bu ülkedeki teknoloji zenginlerinin LLM’lerle beni geniş ölçekte profilleyip, Çin’in gerçek ya da hayali sosyal kredi puanından çok daha distopik bir şeyi burada inşa etmesinden daha fazla endişe ediyorum
      ABD’de yaşayan sana Çin hükümetinden korkman gerektiğini anlatmaya çalışanlar, belki de asıl korkman gereken kişilerdir

  • Bunu copilot’a bağlamaya çalışan varsa, geçmişte bağlantıyı yöneten bir proxy script hazırlamıştım; işinize yarayabilir: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...