DeepSeek, V4 Pro fiyat indirimini kalıcı hale getirdi
(api-docs.deepseek.com)- DeepSeek-V4-Pro API fiyatı, %75 indirim promosyonu sona erdikten sonra da resmi olarak önceki fiyatın 1/4 seviyesinde kalacak
- Ücretlendirme, 1 milyon token başına fiyat üzerinden yapılıyor ve girdi tokenları ile çıktı tokenları kullanımına göre bakiyeden doğrudan düşülüyor
- Desteklenen modeller DeepSeek-V4-Flash ve DeepSeek-V4-Pro; her ikisi de düşünmesiz mod ile düşünme modunu destekliyor ve varsayılan ayar düşünme modu
- Her iki modelde de bağlam uzunluğu 1M, azami çıktı 384K; eşzamanlılık sınırı ise Flash için 2500, Pro için 500
- Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi ve bu düzenleme 26 Nisan 2026 12:15 UTC'den itibaren geçerli
Ücretlendirme ölçütü
- Fiyat birimi, 1 milyon token başına ücrettir; token, modelin tanıdığı en küçük metin birimidir ve kelime, sayı ya da noktalama işareti olabilir
- Faturalandırma ölçütü, modelin toplam girdi tokenı ve çıktı tokenıdır
- Maliyet,
token sayısı × fiyatşeklinde hesaplanır ve yüklenen bakiyeden veya ödeme bakiyesinden doğrudan düşülür - Hem yükleme bakiyesi hem de ödeme bakiyesi varsa önce ödeme bakiyesi kullanılır
- Ürün fiyatları değişebilir ve DeepSeek fiyat ayarlama hakkını saklı tutar
- Gerçek kullanım miktarına göre bakiye yüklenmesi ve güncel fiyatların ilgili sayfadan düzenli olarak kontrol edilmesi önerilir
Modeller ve fiyatlar
-
Desteklenen modeller
- DeepSeek-V4-Flash ve DeepSeek-V4-Pro sunuluyor
- Her iki model de düşünmesiz mod ile düşünme modunu destekliyor; varsayılan ayar düşünme modu
deepseek-chatvedeepseek-reasonermodel adları gelecekte kullanımdan kaldırılacak- Uyumluluk için
deepseek-chat,deepseek-v4-flashmodelinin düşünmesiz moduna;deepseek-reasonerisedeepseek-v4-flashmodelinin düşünme moduna karşılık gelir
-
Uç noktalar ve özellikler
- Anthropic biçimindeki Base URL: https://api.deepseek.com/anthropic
- Düşünme modunun nasıl değiştirileceği Thinking Mode sayfasında görülebilir
- İlgili özellik belgeleri: Json Output, Tool Calls, Chat Prefix Completion(Beta), FIM Completion(Beta)
-
Bağlam ve çıktı sınırı
- Bağlam uzunluğu 1M
- Azami çıktı 384K
1 milyon token başına fiyat
| Kalem | DeepSeek-V4-Flash | DeepSeek-V4-Pro |
|---|---|---|
| Girdi tokenı, önbellek isabeti | $0.0028 | $0.003625 |
| Girdi tokenı, önbellek kaçırması | $0.14 | $0.435 |
| Çıktı tokenı | $0.28 | $0.87 |
| Eşzamanlılık sınırı | 2500 | 500 |
-
DeepSeek-V4-Pro indirim düzenlemesi
- DeepSeek-V4-Pro fiyatı %75 indirimli fiyat olarak gösteriliyor
- Önbellek isabetli girdi tokenı fiyatı önceki $0.0145 seviyesinden $0.003625'e indirildi
- Önbellek kaçırmalı girdi tokenı fiyatı önceki $1.74 seviyesinden $0.435'e indirildi
- Çıktı tokenı fiyatı önceki $3.48 seviyesinden $0.87'ye indirildi
- %75 indirim promosyonu 31 Mayıs 2026 15:59 UTC'de sona erdikten sonra da DeepSeek-V4-Pro API fiyatı resmi olarak önceki fiyatın 1/4 seviyesine ayarlandı
-
Önbellek isabet fiyatında indirim
- Tüm modellerin girdi önbelleği isabet fiyatı çıkış fiyatının 1/10'una indirildi
- Bu fiyat düzenlemesi 26 Nisan 2026 12:15 UTC'den itibaren geçerli
-
Eşzamanlılık sınırı
- DeepSeek-V4-Flash için eşzamanlılık sınırı 2500
- DeepSeek-V4-Pro için eşzamanlılık sınırı 500
- Eşzamanlılık sınırının ayrıntıları Rate Limit & Isolation sayfasında görülebilir
1 yorum
Hacker News yorumları
Kendi kodlama ajanını çıkarırsa DeepSeek modellerini ana seçenek olarak kullanmaya başlayabilirim
Modeli açık kaynak yapma, araştırma yayımlama ve düşük fiyatı koruma gibi konularda sürekli “doğru yönde” ilerliyor gibi görünüyor
Claude Code içinde V4 Pro kullanılabiliyor 1
Bizzat denedim, etkileyiciydi
OpenCode ile de çok iyi çalışıyor
Ekibimiz başka bir abonelik hizmetindeki 5 saat sınırına sık sık takılıyor; yedek olarak DeepSeek bulundurmak oldukça iyi oluyor
Sadece 50 dolar yükledim ama sanki hiç bitmeyecekmiş gibi geliyor
Henüz en ileri modellerin yerini tamamen alacak seviyede değil ama yedek olarak kesinlikle harika
DeepSeek’in illa kendi kodlama ajanını da sunması gerektiğini sanmıyorum
Modeli alıp mevcut herhangi bir kodlama ajanına bağlamak yeterli
Ben şahsen Pi tercih ediyorum ama herkes kendine uygun olanı kullanabilir
Bu haftanın başından beri kendi kod tabanımda Çin modellerini test etmeye başladım
Şimdilik daha çok sohbetli kodlamadan ziyade issue sınıflandırma, otomatik hata düzeltme ve log analizi gibi şeylere baktım; DeepSeek, Kimi, GLM, Qwen ve MiMO’yu GPT-5.5 high ile karşılaştırdım ve hepsini Pi harness üzerinde kurulum gerektirmeden çalıştırdım
Şu ana kadar Kimi ve MiMO en umut verici görünenler
Yeterince sıkı test etmiş değilim ama ilk izlenimim, günlük iş akışındaki genel görevlerde bu modellerin insanların düşündüğü kadar geride olmayabileceği yönünde
Yine de “akıllıca çalışmaktan çok çok çalışmaya” daha yakınlar; benzer sonuca daha yavaş ulaşıyor ve daha fazla token harcıyorlar ama fiyatları çok daha düşük
Kodlama ajanlarının model sağlayıcısından bir ölçüde bağımsız olması daha iyi olur
Sağlayıcılar kaliteyi, özellikleri ve fiyatları çok sık değiştiriyor; her seferinde ajanı da değiştirmek istemem
Ortamın biraz yavaşlayıp oturmasını umuyorum
Bunun hemen şimdi olması gerektiğini söylemiyorum ama o noktaya gelmek güzel olurdu
DeepSeek V4’ü hâlâ denemediyseniz ciddi şeyler kaçırıyorsunuz
Fiyatına göre inanması zor derecede iyi
DeepSeek’in düşünce zincirini okumak gerçekten çok ilginç
OpenCode bunu göstermiyor ama kendiniz okuyunca bu modelin ne kadar az takdir edildiğine şaşırabilirsiniz
Model kullanımım çok düşük olsa da, modeli açık kaynak yapmalarına duyduğum minnet ve bunu genel olarak toplumsal fayda olarak görmem nedeniyle DeepSeek’e düzenli olarak doğrudan para ödüyorum
İyi ve ucuz ama siyaset açıldığında sansür kuralları gibi şeyler devreye girebiliyor
Düşünce sürecini izlerken bir anda her şeyi silip hiçbir açıklama yapmadan başka bir konuya geçmeyi önerdiğine tanık oldum
Bir keresinde de haber medyasının halka hizmet etmesi gerektiği tarzında genel geçer bir mesaj üretti
İki durumda da talep hassas değildi, yasa dışı ya da rejim karşıtı da değildi; bu yüzden şaşırdım
Ama konu azıcık politikti ve bu yetti
Batı’daki sansür genelde daha incelikli olduğu için bu hem ürkütücü hem de tuhaf biçimde taze geldi
Evet, model gerçekten çok iyi
İşte Claude kullanıyorum, kişisel kullanımda DeepSeek kullanıyorum; beni aktif olarak iflas ettirmeye çalışmayan tek model bu
Bazı görevlerde V4 Pro’yu seviyorum ama kodlamada V4 Flash epey etkileyiciydi
Kısa ve öz, hedefi iyi tutturuyor, daha az hata yapıyor ve oldukça hızlı
opencode CLI’da akıl yürütme izleri görünüyor
Belki bir ayar sorunudur
opencode içinde akıl yürütme gösterimini açıp kapatabiliyorsun
Bu fiyat şüphe uyandıracak kadar ucuz
Aynı model başka sağlayıcılarda host edilince çok daha pahalı 0
O yüzden ya DeepSeek bunu başkalarından çok daha ucuza host edebiliyor ya da iş modeli farklı; bence ikincisi
Özellikle gizlilik politikasında 1, “User Input” dahil kişisel verileri “hizmeti iyileştirme ve geliştirme, teknoloji eğitimi ve iyileştirmesi” için kullanabileceklerini söyledikleri için
Belki aptalca bir soru ama OpenRouter’a bakınca DeepSeek sağlayanların gerçekten sadece ABD, Singapur ve Çin dışında olmadığı mı sonucu çıkıyor?
Avrupa’da ya da başka Batılı sağlayıcılarda sunulmak için fazla bariz bir fırsat gibi duruyor
Bunun Mistral’dan çok daha büyük bir sıçrama olduğuna eminim
Bu modelleri kullanmak istiyorum ama standart hukuki gerekliliklerin ötesinde verilerimle eğitim yapan veya onları saklayan sağlayıcılardan kaçınmak istiyorum
Birden fazla etken birlikte rol oynuyor
Inference stack verimliliği açısından birçok sağlayıcı hazır sglang / vllm / trtllm alıp en iyisini umuyor ama DeepSeek ekibi optimizasyon sınırlarını zorlamasıyla biliniyor
sglang ve vllm mükemmel yazılımlar ama DeepSeek’in seyrek attention yaklaşımı olan DSA’ya bakarsanız bunun 1,5 yıl önce getirildiğini görürsünüz (https://arxiv.org/abs/2512.02556) ve DeepSeek 3.2, GLM 5, DeepSeek V4’te kullanıldı
Ancak şimdi büyük inference motorlarında optimizasyonlar yavaş yavaş gelmeye başlıyor: (https://github.com/sgl-project/sglang/issues/19380 https://github.com/sgl-project/sglang/pull/22851 vb.)
Elbette DS V4, DSA’nın üstüne ek model mimarisi optimizasyonları da ekliyor ve açık kaynak inference motorlarının bundan tam yararlanması zaman alacak
Gizlilik tarafında ise, insanların Çin dışındaki hosting için ek ücret ödeyeceği yönünde bir bahis var
Özellikle de DeepSeek API verilerini model iyileştirmesinde kullandığını şeffaf biçimde söylediği için
Bunların dışında ölçek var; MoE’de bu çok önemli, ayrıca güvenilirlik ve yumuşak kurumsal müşteri bağımlılığı gibi faktörler de var
Ayrıca örtük danışıklı fiyatlandırma ihtimali de yüksek
GLM 5 ile GLM 5.1 fiyatlarına bakarsanız çalıştırma maliyetleri aynı ama 5.1 çok daha iyi bir model; Z.AI da fiyatı yükselttiği için sağlayıcılar 5.1’i daha pahalı fiyatladı
Açıkça zararına satıyorlar
E olsun, neden olmasın?
Zarar ederek pazar payı kazanmak sadece ABD’ye özgü bir şey değil
DeepSeek’in kurucusu Liang Wenfeng hakkında yeterince bilgi sahibi olmayabilirsiniz
Kendisi aynı zamanda High-Flyer Quant’ın da kurucusu
Ben daha çok cache tarafını merak ediyorum
“Tüm modellerde input cache hit fiyatı lansman fiyatının 1/10’una düşürüldü ve bu fiyat ayarı 2026/4/26 12:15 UTC itibarıyla geçerli” deniyor
Herhangi bir bitiş tarihi yok
Şu anda DeepSeek V4 Flash, input fiyatının %2’si; bu V4 Pro fiyatıyla %0,8 ediyor ve rakiplere kıyasla aşırı düşük, hatta birim ekonomiyi etkileyecek kadar düşük olduğu için bunun geçici olduğunu sanmıştım
V4 Pro için cache hesaba katıldığında gerçek maliyet input tarafında 1 milyon token başına yaklaşık $0.04 ediyor (OpenRouter metriklerine göre: https://openrouter.ai/deepseek/deepseek-v4-pro)
Rakiplerin küçük modellerinden bile çok daha ucuz
DeepSeek V4’ün KV cache’i, güçlü biçimde sıkıştırılmış seyrek attention yapısı sayesinde çok verimli
Yalnızca DSA kullanan DeepSeek V3.2 daha küçük bir model olmasına rağmen, 1 milyon context window’da DS V4 Pro’dan 10 kat fazla bellek kullanıyor
Ayrıca DeepSeek API’nin cache hit oranı da çok iyi
Aynı iş yükünde açık ağırlıklı modeller sunan büyük Batılı inference sağlayıcılarında KV cache hit oranı yaklaşık %50 iken DS API’de yaklaşık %80 görüyorum
DeepSeek V4’ün büyük olayı KV cache boyutunun ciddi ölçüde küçülmüş olması
Flash kendi başına çok rekabetçi bir model değil ve fiyatı da piyasadaki diğer modellerle benzer aralıkta
Flash modelin en doğrudan rakipleri muhtemelen şunlar:
GPT 5.4 mini
Cache Read
$0.075
/M tokens
Gemini 3 flash:
Cache Read
$0.05
/M tokens
Yani burada özel bir sihir ya da çığır açan bir durum yok
Sonnet:
Cache Read
$0.30
Gemini 3.5 flash:
Cache Read
$0.15
Müthiş bir fiyat/performans
Bir süredir GLM 5.1 ile GLM Coding Plan Max kullanıyordum ve DeepSeek V4 Pro’yu da yaklaşık 3 haftadır test ediyorum; karmaşık kodlama işlerinde GLM 5.1’den daha iyi olduğunu düşünüyorum
65 milyon token kullandım, bu fiyatlarla 1,5 dolar tuttu; gerçekten çok ucuz
İnanılmaz
Bu durumda DeepSeek V4 Pro, aynı kategorideki diğer modellere kıyasla aşırı ucuz kalıyor
1 milyon output token başına fiyatlara bakarsak:
DeepSeek V4 Pro: $0.87
Qwen 3.7 Max: $7.50
Grok 4.3: $2.50
GLM 1.5: $3.08
Opus 4.7: $25.00
GPT-5.5: $30.00
Ajan iş akışlarında belirleyici maliyet bu olabilir ve DeepSeek’in cache read fiyatı karşılaştırılamayacak kadar düşük
1 milyon token başına $0.003626, listedeki bundan sonraki en ucuz seçenek bile 1 milyon başına $0.2’nin üzerinde
Neredeyse 100 kat fark var
Yani mesele, insanların sınırsızca para yakmasına izin vermeden de inference’ı verimli yapabilmekmiş
Opus ne kadar iyi olursa olsun, iki ay sonra maliyet kısmak için onu GPT-3’ten kötü hale getireceklerse bunun bir anlamı yok
V4 Pro indirimi hesaba katılsa bile V4 Flash, dolar başına performansta en iyi seçenek; ajan tarzı ve yoğun araç kullanımı gerektiren işlerde genel performansı da daha iyi
V4 Pro tek seferlik akıl yürütmede daha zeki ama hız farkı büyük
Performans, maliyet ve hızı birlikte düşününce V4 Flash şu anda bizim ölçütlerimize göre açık ara en iyi flash model
Veriler https://gertlabs.com/rankings adresinde
Bu MLA mimarisi, standart attention’a kıyasla KV cache’i yaklaşık 5 ila 13 kat küçültüyor
Dolayısıyla bu sadece pazar payı kazanmak için yürütülen bir fiyat savaşı değil; inference çalıştırma maliyetleri gerçekten daha düşük
Sıradan tüketici platformlarında uzun context, batch inference ve KV cache’in diske yazılması mümkün hale geliyor
Bu indirim, yeni nesil modelde cache’lemenin ne kadar verimli çalıştığını doğrulamaya dönük bir lansman sonrası pazar deneyi olmuş olabilir
ABD’de host edilen modellere kıyasla Çin’de host edilen modellerde kazara veri sızıntısı konusunda daha çok endişeliyim
Örneğin ajanın env dosyasını okuması gibi durumlar
Çin hükümetinin tüm konuşmaları tarayıp işine yarayan bilgileri saklama olasılığının ABD hükümeti veya şirketlerinden daha yüksek olduğundan şüphelenmem yanlış mı?
Bunun önyargılı ve yabancı düşmanı gibi duyulabileceğini düşündüğüm için bu yorumu yazarken bile tereddüt ettim
Umarım biri beni yanlış düşündüğüme ikna eder
DeepSeek hosting’inin arkasındaki şirketin nasıl bir yapısı olduğunu ya da veri gizliliğine saygı gösterme konusunda bir geçmişi olup olmadığını bilen var mı?
Bu mantıksız bir kaygı değil
Zaten çoğu ABD şirketi bu yüzden AWS Bedrock ya da yapay zeka laboratuvarlarını tercih ediyor ve genelde veri saklamama sözleşmesi talep ediyor
Ama bence sızıntı riski hosting nerede olursa olsun var; değişen şey teşvik yapısı
Mesela laboratuvarlar da bütün konuşmaları tarıyor ve kurumsal ZDR sözleşmeleriyle korunmayan verilerle eğitim yapıyor
Kolluk kuvvetleri, geçerli bir mahkeme kararıyla ya da acil durumlarda tüm kullanıcı verilerine erişim talep edebiliyor 1
DeepSeek V4’ü gizli biçimde kullanmak istiyorsanız Tinfoil’i (tinfoil.sh) deneyebilirsiniz
Tüm modelleri doğrulanabilir güvenli donanım enclave’lerinde host ederek inference’ı uçtan uca gizli hale getiriyor
Açık olayım, kurucu ortaklardan biriyim
1 https://cdn.openai.com/trust-and-transparency/openai-law-enf...
Azure gibi bir şey üzerinden kullanabilirsiniz
Tüm modeli host ediyor ve ABD’den sunuyor
Bunun gibi başka sağlayıcılar da vardır
Biz böyle kullanıyoruz ve gayet iyi çalışıyor
Bunu yapıyor olsalar şaşırmam
ABD merkezli modellerin başka hükümetler adına aynısını yaptığını duysam da çok şaşırmam
Veri gizliliği konusunda büyük beklentilerim yok
Microsoft kurumsal tarafta tüm kutucukları işaretliyor olabilir ama Azure da bazen ihlal ediliyor
Bunun olma olasılığının sıfır olmadığını düşünüyorum
Pekin herhangi bir anda DeepSeek’in fazla güçlü olduğuna ya da önemli bir ihracat ürünü haline geldiğine karar verip müdahale edebilir
Hatta bunun zaten yapılmadığının garantisi de yok
Çin’le sınırlı olmayan yabancı aktörlerin, ABD’de birçok sektörde kritik ağlara büyük çapta sızdığına ve uygun zamanı bekleyip bunları kötüye kullanacağına dair çok sayıda rapor var
En gelişmiş modeller de bir başka saldırı vektörü ve düşününce kötüye kullanımı çok daha kolay olabilir
Aslında bulutta host edilen her modelde bu ihtimal var
İster modeli yapan şirket bunu bilerek yapsın ister kötü niyetli bir aktör bir açığı sömürsün
Çin’den birinin özellikle beni hedef alacak kadar önemli biri değilim
Üstelik DeepSeek’in kullanıcıların platformu kullanmaya devam etmesi için yeterli güveni koruması gerekiyor
Herkesin kripto cüzdanını hedef alan bir keylogger gibi davranırlarsa bu güven çöker
Çin hükümetinin stratejik açıdan önemli göreceği bir iş yapıyor olsaydım elbette endişelenirdim ama ben öyle bir şey yapmıyorum
Açıkçası bu ülkedeki teknoloji zenginlerinin LLM’lerle beni geniş ölçekte profilleyip, Çin’in gerçek ya da hayali sosyal kredi puanından çok daha distopik bir şeyi burada inşa etmesinden daha fazla endişe ediyorum
ABD’de yaşayan sana Çin hükümetinden korkman gerektiğini anlatmaya çalışanlar, belki de asıl korkman gereken kişilerdir
Bunu copilot’a bağlamaya çalışan varsa, geçmişte bağlantıyı yöneten bir proxy script hazırlamıştım; işinize yarayabilir: https://gist.github.com/g023/c2bb7b540ffe64cee76023f18f6f936...