DeepSeek, V4 Pro fiyat indirimini kalıcı hale getirdi

(api-docs.deepseek.com)

3 puan yazan GN⁺ 2026-05-23 | 3 yorum | WhatsApp'ta paylaş

DeepSeek-V4-Pro API fiyatı, %75 indirim promosyonu sona erdikten sonra da resmi olarak önceki fiyatın 1/4 seviyesinde kalacak
Ücretlendirme, 1 milyon token başına fiyat üzerinden yapılıyor ve girdi tokenları ile çıktı tokenları kullanımına göre bakiyeden doğrudan düşülüyor
Desteklenen modeller DeepSeek-V4-Flash ve DeepSeek-V4-Pro; her ikisi de düşünmesiz mod ile düşünme modunu destekliyor ve varsayılan ayar düşünme modu
Her iki modelde de bağlam uzunluğu 1M, azami çıktı 384K; eşzamanlılık sınırı ise Flash için 2500, Pro için 500
Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi ve bu düzenleme 26 Nisan 2026 12:15 UTC'den itibaren geçerli

Ücretlendirme ölçütü

Fiyat birimi, 1 milyon token başına ücrettir; token, modelin tanıdığı en küçük metin birimidir ve kelime, sayı ya da noktalama işareti olabilir
Faturalandırma ölçütü, modelin toplam girdi tokenı ve çıktı tokenıdır
Maliyet, token sayısı × fiyat şeklinde hesaplanır ve yüklenen bakiyeden veya ödeme bakiyesinden doğrudan düşülür
Hem yükleme bakiyesi hem de ödeme bakiyesi varsa önce ödeme bakiyesi kullanılır
Ürün fiyatları değişebilir ve DeepSeek fiyat ayarlama hakkını saklı tutar
Gerçek kullanım miktarına göre bakiye yüklenmesi ve güncel fiyatların ilgili sayfadan düzenli olarak kontrol edilmesi önerilir

Modeller ve fiyatlar

Desteklenen modeller
- DeepSeek-V4-Flash ve DeepSeek-V4-Pro sunuluyor
- Her iki model de düşünmesiz mod ile düşünme modunu destekliyor; varsayılan ayar düşünme modu
- deepseek-chat ve deepseek-reasoner model adları gelecekte kullanımdan kaldırılacak
- Uyumluluk için deepseek-chat, deepseek-v4-flash modelinin düşünmesiz moduna; deepseek-reasoner ise deepseek-v4-flash modelinin düşünme moduna karşılık gelir
Uç noktalar ve özellikler
- Anthropic biçimindeki Base URL: https://api.deepseek.com/anthropic
- Düşünme modunun nasıl değiştirileceği Thinking Mode sayfasında görülebilir
- İlgili özellik belgeleri: Json Output, Tool Calls, Chat Prefix Completion（Beta）, FIM Completion（Beta）
Bağlam ve çıktı sınırı
- Bağlam uzunluğu 1M
- Azami çıktı 384K

1 milyon token başına fiyat

Kalem	DeepSeek-V4-Flash	DeepSeek-V4-Pro
Girdi tokenı, önbellek isabeti	$0.0028	$0.003625
Girdi tokenı, önbellek kaçırması	$0.14	$0.435
Çıktı tokenı	$0.28	$0.87
Eşzamanlılık sınırı	2500	500

DeepSeek-V4-Pro indirim düzenlemesi
- DeepSeek-V4-Pro fiyatı %75 indirimli fiyat olarak gösteriliyor
- Önbellek isabetli girdi tokenı fiyatı önceki $0.0145 seviyesinden $0.003625'e indirildi
- Önbellek kaçırmalı girdi tokenı fiyatı önceki $1.74 seviyesinden $0.435'e indirildi
- Çıktı tokenı fiyatı önceki $3.48 seviyesinden $0.87'ye indirildi
- %75 indirim promosyonu 31 Mayıs 2026 15:59 UTC'de sona erdikten sonra da DeepSeek-V4-Pro API fiyatı resmi olarak önceki fiyatın 1/4 seviyesine ayarlandı
Önbellek isabet fiyatında indirim
- Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi
- Bu fiyat düzenlemesi 26 Nisan 2026 12:15 UTC'den itibaren geçerli
Eşzamanlılık sınırı
- DeepSeek-V4-Flash için eşzamanlılık sınırı 2500
- DeepSeek-V4-Pro için eşzamanlılık sınırı 500
- Eşzamanlılık sınırının ayrıntıları Rate Limit & Isolation sayfasında görülebilir

3 yorum

j2sus91 27 일 전

Şartlara bakarsanız, API kullanımının eğitim için kullanılmadığını açıkça belirten bir madde olmadığını söylüyorlar.
Bu kısmı göz önünde bulundurarak kullanmanız iyi olabilir~

myoun 28 일 전

Oh, güzelmiş

GN⁺ 2026-05-23

Hacker News yorumları

Kendi kodlama ajanını çıkarırsa DeepSeek modellerini ana seçenek olarak kullanmaya başlayabilirim
Modeli açık kaynak yapma, araştırma yayımlama ve düşük fiyatı koruma gibi konularda sürekli “doğru yönde” ilerliyor gibi görünüyor
- Claude Code içinde V4 Pro kullanılabiliyor 1
  Bizzat denedim, etkileyiciydi
- OpenCode ile de çok iyi çalışıyor
  Ekibimiz başka bir abonelik hizmetindeki 5 saat sınırına sık sık takılıyor; yedek olarak DeepSeek bulundurmak oldukça iyi oluyor
  Sadece 50 dolar yükledim ama sanki hiç bitmeyecekmiş gibi geliyor
  
  Henüz en ileri modellerin yerini tamamen alacak seviyede değil ama yedek olarak kesinlikle harika
- DeepSeek’in illa kendi kodlama ajanını da sunması gerektiğini sanmıyorum
  Modeli alıp mevcut herhangi bir kodlama ajanına bağlamak yeterli
  Ben şahsen Pi tercih ediyorum ama herkes kendine uygun olanı kullanabilir
- Bu haftanın başından beri kendi kod tabanımda Çin modellerini test etmeye başladım
  Şimdilik daha çok sohbetli kodlamadan ziyade issue sınıflandırma, otomatik hata düzeltme ve log analizi gibi şeylere baktım; DeepSeek, Kimi, GLM, Qwen ve MiMO’yu GPT-5.5 high ile karşılaştırdım ve hepsini Pi harness üzerinde kurulum gerektirmeden çalıştırdım
  
  Şu ana kadar Kimi ve MiMO en umut verici görünenler
  Yeterince sıkı test etmiş değilim ama ilk izlenimim, günlük iş akışındaki genel görevlerde bu modellerin insanların düşündüğü kadar geride olmayabileceği yönünde
  
  Yine de “akıllıca çalışmaktan çok çok çalışmaya” daha yakınlar; benzer sonuca daha yavaş ulaşıyor ve daha fazla token harcıyorlar ama fiyatları çok daha düşük
- Kodlama ajanlarının model sağlayıcısından bir ölçüde bağımsız olması daha iyi olur
  Sağlayıcılar kaliteyi, özellikleri ve fiyatları çok sık değiştiriyor; her seferinde ajanı da değiştirmek istemem
  
  Ortamın biraz yavaşlayıp oturmasını umuyorum
  Bunun hemen şimdi olması gerektiğini söylemiyorum ama o noktaya gelmek güzel olurdu
DeepSeek V4’ü hâlâ denemediyseniz ciddi şeyler kaçırıyorsunuz
Fiyatına göre inanması zor derecede iyi

DeepSeek’in düşünce zincirini okumak gerçekten çok ilginç
OpenCode bunu göstermiyor ama kendiniz okuyunca bu modelin ne kadar az takdir edildiğine şaşırabilirsiniz

Model kullanımım çok düşük olsa da, modeli açık kaynak yapmalarına duyduğum minnet ve bunu genel olarak toplumsal fayda olarak görmem nedeniyle DeepSeek’e düzenli olarak doğrudan para ödüyorum
- İyi ve ucuz ama siyaset açıldığında sansür kuralları gibi şeyler devreye girebiliyor
  Düşünce sürecini izlerken bir anda her şeyi silip hiçbir açıklama yapmadan başka bir konuya geçmeyi önerdiğine tanık oldum
  Bir keresinde de haber medyasının halka hizmet etmesi gerektiği tarzında genel geçer bir mesaj üretti
  
  İki durumda da talep hassas değildi, yasa dışı ya da rejim karşıtı da değildi; bu yüzden şaşırdım
  Ama konu azıcık politikti ve bu yetti
  Batı’daki sansür genelde daha incelikli olduğu için bu hem ürkütücü hem de tuhaf biçimde taze geldi
- Evet, model gerçekten çok iyi
  İşte Claude kullanıyorum, kişisel kullanımda DeepSeek kullanıyorum; beni aktif olarak iflas ettirmeye çalışmayan tek model bu
- Bazı görevlerde V4 Pro’yu seviyorum ama kodlamada V4 Flash epey etkileyiciydi
  Kısa ve öz, hedefi iyi tutturuyor, daha az hata yapıyor ve oldukça hızlı
- opencode CLI’da akıl yürütme izleri görünüyor
  Belki bir ayar sorunudur
- opencode içinde akıl yürütme gösterimini açıp kapatabiliyorsun
Bu fiyat şüphe uyandıracak kadar ucuz
Aynı model başka sağlayıcılarda host edilince çok daha pahalı 0
O yüzden ya DeepSeek bunu başkalarından çok daha ucuza host edebiliyor ya da iş modeli farklı; bence ikincisi
Özellikle gizlilik politikasında 1, “User Input” dahil kişisel verileri “hizmeti iyileştirme ve geliştirme, teknoloji eğitimi ve iyileştirmesi” için kullanabileceklerini söyledikleri için
- Belki aptalca bir soru ama OpenRouter’a bakınca DeepSeek sağlayanların gerçekten sadece ABD, Singapur ve Çin dışında olmadığı mı sonucu çıkıyor?
  Avrupa’da ya da başka Batılı sağlayıcılarda sunulmak için fazla bariz bir fırsat gibi duruyor
  Bunun Mistral’dan çok daha büyük bir sıçrama olduğuna eminim
  
  Bu modelleri kullanmak istiyorum ama standart hukuki gerekliliklerin ötesinde verilerimle eğitim yapan veya onları saklayan sağlayıcılardan kaçınmak istiyorum
- Birden fazla etken birlikte rol oynuyor
  Inference stack verimliliği açısından birçok sağlayıcı hazır sglang / vllm / trtllm alıp en iyisini umuyor ama DeepSeek ekibi optimizasyon sınırlarını zorlamasıyla biliniyor
  
  sglang ve vllm mükemmel yazılımlar ama DeepSeek’in seyrek attention yaklaşımı olan DSA’ya bakarsanız bunun 1,5 yıl önce getirildiğini görürsünüz (https://arxiv.org/abs/2512.02556) ve DeepSeek 3.2, GLM 5, DeepSeek V4’te kullanıldı
  Ancak şimdi büyük inference motorlarında optimizasyonlar yavaş yavaş gelmeye başlıyor: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 vb.)
  Elbette DS V4, DSA’nın üstüne ek model mimarisi optimizasyonları da ekliyor ve açık kaynak inference motorlarının bundan tam yararlanması zaman alacak
  
  Gizlilik tarafında ise, insanların Çin dışındaki hosting için ek ücret ödeyeceği yönünde bir bahis var
  Özellikle de DeepSeek API verilerini model iyileştirmesinde kullandığını şeffaf biçimde söylediği için
  
  Bunların dışında ölçek var; MoE’de bu çok önemli, ayrıca güvenilirlik ve yumuşak kurumsal müşteri bağımlılığı gibi faktörler de var
  
  Ayrıca örtük danışıklı fiyatlandırma ihtimali de yüksek
  GLM 5 ile GLM 5.1 fiyatlarına bakarsanız çalıştırma maliyetleri aynı ama 5.1 çok daha iyi bir model; Z.AI da fiyatı yükselttiği için sağlayıcılar 5.1’i daha pahalı fiyatladı
- Açıkça zararına satıyorlar
  E olsun, neden olmasın?
  Zarar ederek pazar payı kazanmak sadece ABD’ye özgü bir şey değil
- DeepSeek’in kurucusu Liang Wenfeng hakkında yeterince bilgi sahibi olmayabilirsiniz
  Kendisi aynı zamanda High-Flyer Quant’ın da kurucusu
Ben daha çok cache tarafını merak ediyorum
“Tüm modellerde input cache hit fiyatı lansman fiyatının 1/10’una düşürüldü ve bu fiyat ayarı 2026/4/26 12:15 UTC itibarıyla geçerli” deniyor

Herhangi bir bitiş tarihi yok
Şu anda DeepSeek V4 Flash, input fiyatının %2’si; bu V4 Pro fiyatıyla %0,8 ediyor ve rakiplere kıyasla aşırı düşük, hatta birim ekonomiyi etkileyecek kadar düşük olduğu için bunun geçici olduğunu sanmıştım

V4 Pro için cache hesaba katıldığında gerçek maliyet input tarafında 1 milyon token başına yaklaşık $0.04 ediyor (OpenRouter metriklerine göre: https://openrouter.ai/deepseek/deepseek-v4-pro)
Rakiplerin küçük modellerinden bile çok daha ucuz
- DeepSeek V4’ün KV cache’i, güçlü biçimde sıkıştırılmış seyrek attention yapısı sayesinde çok verimli
  Yalnızca DSA kullanan DeepSeek V3.2 daha küçük bir model olmasına rağmen, 1 milyon context window’da DS V4 Pro’dan 10 kat fazla bellek kullanıyor
  
  Ayrıca DeepSeek API’nin cache hit oranı da çok iyi
  Aynı iş yükünde açık ağırlıklı modeller sunan büyük Batılı inference sağlayıcılarında KV cache hit oranı yaklaşık %50 iken DS API’de yaklaşık %80 görüyorum
- DeepSeek V4’ün büyük olayı KV cache boyutunun ciddi ölçüde küçülmüş olması
- Flash kendi başına çok rekabetçi bir model değil ve fiyatı da piyasadaki diğer modellerle benzer aralıkta
  Flash modelin en doğrudan rakipleri muhtemelen şunlar:
  
  GPT 5.4 mini
  
  Cache Read
  $0.075
  /M tokens
  
  Gemini 3 flash:
  
  Cache Read
  $0.05
  /M tokens
  
  Yani burada özel bir sihir ya da çığır açan bir durum yok
- Sonnet:
  Cache Read
  $0.30
  
  Gemini 3.5 flash:
  Cache Read
  $0.15
Müthiş bir fiyat/performans
Bir süredir GLM 5.1 ile GLM Coding Plan Max kullanıyordum ve DeepSeek V4 Pro’yu da yaklaşık 3 haftadır test ediyorum; karmaşık kodlama işlerinde GLM 5.1’den daha iyi olduğunu düşünüyorum
65 milyon token kullandım, bu fiyatlarla 1,5 dolar tuttu; gerçekten çok ucuz
- DeepSeek sanki diğer modellere göre çok daha fazla token tüketiyor
İnanılmaz
Bu durumda DeepSeek V4 Pro, aynı kategorideki diğer modellere kıyasla aşırı ucuz kalıyor
1 milyon output token başına fiyatlara bakarsak:

DeepSeek V4 Pro: $0.87

Qwen 3.7 Max: $7.50

Grok 4.3: $2.50

GLM 1.5: $3.08

Opus 4.7: $25.00

GPT-5.5: $30.00
- Cache read maliyetini de katınca fiilen daha da ucuz
  Ajan iş akışlarında belirleyici maliyet bu olabilir ve DeepSeek’in cache read fiyatı karşılaştırılamayacak kadar düşük
  1 milyon token başına $0.003626, listedeki bundan sonraki en ucuz seçenek bile 1 milyon başına $0.2’nin üzerinde
  Neredeyse 100 kat fark var
- Bir dahaki sefere biri “kullanım limitleri yüzünden sızlanma, aboneliğinle şirket zaten zarar ediyor” dediğinde bu yorumu paylaşacağım
  Yani mesele, insanların sınırsızca para yakmasına izin vermeden de inference’ı verimli yapabilmekmiş
- Abone olduktan sonra modeli kötüleştirmiyorlar da
  Opus ne kadar iyi olursa olsun, iki ay sonra maliyet kısmak için onu GPT-3’ten kötü hale getireceklerse bunun bir anlamı yok
- GLM 5.1
V4 Pro indirimi hesaba katılsa bile V4 Flash, dolar başına performansta en iyi seçenek; ajan tarzı ve yoğun araç kullanımı gerektiren işlerde genel performansı da daha iyi
V4 Pro tek seferlik akıl yürütmede daha zeki ama hız farkı büyük
Performans, maliyet ve hızı birlikte düşününce V4 Flash şu anda bizim ölçütlerimize göre açık ara en iyi flash model

Veriler https://gertlabs.com/rankings adresinde
- Benim kullanım senaryomda, çoğunlukla çok büyük özetleme ve fikir çıkarımı işlerinde Pro’ya kıyasla epey zayıf kaldı
Bu MLA mimarisi, standart attention’a kıyasla KV cache’i yaklaşık 5 ila 13 kat küçültüyor
Dolayısıyla bu sadece pazar payı kazanmak için yürütülen bir fiyat savaşı değil; inference çalıştırma maliyetleri gerçekten daha düşük
- Yerel inference için de oyun değiştirici
  Sıradan tüketici platformlarında uzun context, batch inference ve KV cache’in diske yazılması mümkün hale geliyor
- Evet
  Bu indirim, yeni nesil modelde cache’lemenin ne kadar verimli çalıştığını doğrulamaya dönük bir lansman sonrası pazar deneyi olmuş olabilir
ABD’de host edilen modellere kıyasla Çin’de host edilen modellerde kazara veri sızıntısı konusunda daha çok endişeliyim
Örneğin ajanın env dosyasını okuması gibi durumlar
Çin hükümetinin tüm konuşmaları tarayıp işine yarayan bilgileri saklama olasılığının ABD hükümeti veya şirketlerinden daha yüksek olduğundan şüphelenmem yanlış mı?

Bunun önyargılı ve yabancı düşmanı gibi duyulabileceğini düşündüğüm için bu yorumu yazarken bile tereddüt ettim
Umarım biri beni yanlış düşündüğüme ikna eder
DeepSeek hosting’inin arkasındaki şirketin nasıl bir yapısı olduğunu ya da veri gizliliğine saygı gösterme konusunda bir geçmişi olup olmadığını bilen var mı?
- Bu mantıksız bir kaygı değil
  Zaten çoğu ABD şirketi bu yüzden AWS Bedrock ya da yapay zeka laboratuvarlarını tercih ediyor ve genelde veri saklamama sözleşmesi talep ediyor
  Ama bence sızıntı riski hosting nerede olursa olsun var; değişen şey teşvik yapısı
  
  Mesela laboratuvarlar da bütün konuşmaları tarıyor ve kurumsal ZDR sözleşmeleriyle korunmayan verilerle eğitim yapıyor
  Kolluk kuvvetleri, geçerli bir mahkeme kararıyla ya da acil durumlarda tüm kullanıcı verilerine erişim talep edebiliyor 1
  
  DeepSeek V4’ü gizli biçimde kullanmak istiyorsanız Tinfoil’i (tinfoil.sh) deneyebilirsiniz
  Tüm modelleri doğrulanabilir güvenli donanım enclave’lerinde host ederek inference’ı uçtan uca gizli hale getiriyor
  Açık olayım, kurucu ortaklardan biriyim
  
  1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...
- Azure gibi bir şey üzerinden kullanabilirsiniz
  Tüm modeli host ediyor ve ABD’den sunuyor
  Bunun gibi başka sağlayıcılar da vardır
  
  Biz böyle kullanıyoruz ve gayet iyi çalışıyor
- Bunu yapıyor olsalar şaşırmam
  ABD merkezli modellerin başka hükümetler adına aynısını yaptığını duysam da çok şaşırmam
  Veri gizliliği konusunda büyük beklentilerim yok
  Microsoft kurumsal tarafta tüm kutucukları işaretliyor olabilir ama Azure da bazen ihlal ediliyor
- Bunun olma olasılığının sıfır olmadığını düşünüyorum
  Pekin herhangi bir anda DeepSeek’in fazla güçlü olduğuna ya da önemli bir ihracat ürünü haline geldiğine karar verip müdahale edebilir
  Hatta bunun zaten yapılmadığının garantisi de yok
  
  Çin’le sınırlı olmayan yabancı aktörlerin, ABD’de birçok sektörde kritik ağlara büyük çapta sızdığına ve uygun zamanı bekleyip bunları kötüye kullanacağına dair çok sayıda rapor var
  En gelişmiş modeller de bir başka saldırı vektörü ve düşününce kötüye kullanımı çok daha kolay olabilir
  
  Aslında bulutta host edilen her modelde bu ihtimal var
  İster modeli yapan şirket bunu bilerek yapsın ister kötü niyetli bir aktör bir açığı sömürsün
- Çin’den birinin özellikle beni hedef alacak kadar önemli biri değilim
  Üstelik DeepSeek’in kullanıcıların platformu kullanmaya devam etmesi için yeterli güveni koruması gerekiyor
  Herkesin kripto cüzdanını hedef alan bir keylogger gibi davranırlarsa bu güven çöker
  
  Çin hükümetinin stratejik açıdan önemli göreceği bir iş yapıyor olsaydım elbette endişelenirdim ama ben öyle bir şey yapmıyorum
  
  Açıkçası bu ülkedeki teknoloji zenginlerinin LLM’lerle beni geniş ölçekte profilleyip, Çin’in gerçek ya da hayali sosyal kredi puanından çok daha distopik bir şeyi burada inşa etmesinden daha fazla endişe ediyorum
  ABD’de yaşayan sana Çin hükümetinden korkman gerektiğini anlatmaya çalışanlar, belki de asıl korkman gereken kişilerdir
Bunu copilot’a bağlamaya çalışan varsa, geçmişte bağlantıyı yöneten bir proxy script hazırlamıştım; işinize yarayabilir: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...

DeepSeek, V4 Pro fiyat indirimini kalıcı hale getirdi

Ücretlendirme ölçütü

Modeller ve fiyatlar

Desteklenen modeller

Uç noktalar ve özellikler

Bağlam ve çıktı sınırı

1 milyon token başına fiyat

DeepSeek-V4-Pro indirim düzenlemesi

Önbellek isabet fiyatında indirim

Eşzamanlılık sınırı

İlgili okumalar

3 yorum

Hacker News yorumları