Dış kaynak iş gücü + LocalAI kombinasyonu yakında frontier lab’lerden daha ekonomik olacak
(signalbloom.ai)- ABD’deki frontier lab’lerin API fiyatları sürekli artarken, düşük maliyetli ülkelerdeki mühendislerle DeepSeek gibi açık kaynak modellerin birleşimi ekonomik bir alternatif olarak öne çıkıyor
- GPT-5.5, Gemini 3.5 Flash, Opus-4.7 gibi en yeni frontier modeller 2 ila 3 kat fiyat artışı yaptı veya token tüketimini yükseltti
- Harmanlanmış token ölçütüne göre karşılaştırmada Anthropic ve OpenAI yaklaşık $2.80/M, DeepSeek ise $0.094/M seviyesinde; yani yaklaşık 30 kat fiyat farkı var
- Frontier modeller daha güçlü olsa da, kodlama kullanımında OSS modeller yeterince iyi bir seviyeye ulaşmış durumda ve yetkin mühendislerle birleştiğinde bu fark telafi edilebilir
- Fiyat artışlarının sonsuza kadar sürememesinin nedeni, dış kaynak + LocalAI kombinasyonunun bir fiyat tavanı işlevi görmesi
Frontier lab’lerin çıkarım maliyetlerindeki yükseliş eğilimi
- Çıkarım maliyetlerinin düştüğü yönündeki yaygın kanaatin aksine, ABD’li frontier lab’lerin fiyatları belirgin bir artış eğiliminde
- GPT-5.5 ($5/$30) lansmanı, GPT-5.4’ten yalnızca 2 ay sonra yapıldı ve API fiyatları genel olarak 2 kat arttı
- 8 ay önceki GPT-5 ($1.25/$10) ile kıyaslandığında 3 kattan fazla daha pahalı
- Gemini 3.5 Flash ($1.50/$9.00), bir önceki model Gemini-3-flash-preview ($0.50/$3.00) karşısında 3 kat zamlı
- Gemini-3-flash-preview de 2.5 Flash’a ($0.30/$2.50) göre zaten daha yüksek fiyatlıydı
- Anthropic Opus-4.7, yeni tokenizer sayesinde token tüketimini %32 ila %47 artırdı; bu da önceki Opus-4.6’ya göre fiili maliyet artışı anlamına geliyor
Frontier kapalı modeller ile açık kaynak modellerin karşılaştırması
- Karşılaştırma, harmanlanmış token tüketim oranı temelinde yapılıyor: giriş(+cache) 1M token başına 50k çıkış token’ı (yaklaşık %5’ten az) varsayılıyor
- Büyük ajan döngülerinde tur sayısı fazla olduğu için okuma ağırlığı yüksektir; bu nedenle bu tahmin muhafazakâr kabul ediliyor
- Her sağlayıcı için cache etkisi hesaba katıldıktan sonra ortalama harmanlanmış fiyat karşılaştırması (kaynak: openrouter.ai)
-
Sağlayıcı bazında fiyat karşılaştırması
- Anthropic: giriş $1.57 / çıkış $25.00 / cache isabet oranı %79.6 → harmanlanmış $2.82
- OpenAI: giriş $1.30 / çıkış $30.22 / cache isabet oranı %84.8 → harmanlanmış $2.80
- DeepSeek: giriş $0.055 / çıkış $0.870 / cache isabet oranı %88.1 → harmanlanmış $0.094
- Bugün kapalı frontier modeller, DeepSeek’in en yeni modellerinden daha güçlü; ancak bu farkın 30 katlık fiyat farkını haklı çıkarıp çıkarmadığı tartışmalı
- OSS LLM’lerin frontier seviyesinde olması gerekmiyor; kodlama için yeterli performans sunmaları yeterli ve bu seviyeye zaten ulaşılmış durumda
Token tüketimindeki artış eğilimi
- Tokenmaxxing trendi son birkaç ay ve yılda hızlandı (Pragmatic Engineer bloguna bakınız)
- Tokenmaxxing’i hedef haline getirmenin akıllıca olmadığı konusunda yetkin mühendisler arasında bir uzlaşı var; ancak bu ayrı bir konu
- Token tüketimindeki büyük artış, GPU kıtlığının sürmesi ile de doğrulanabiliyor
- Token tüketimindeki artış ve token başına fiyat zamları aynı anda yaşanıyor; bu da ABD’li frontier lab’lerin değer yakalama stratejisiyle bağlantılı
(İnsan + yarı-frontier LLM) ile frontier LLM karşılaştırması
- İnsan mühendislerle AI ajanlarını 12 eksende karşılaştıran ayrı bir analiz bulunuyor (signalbloom.ai)
- Sonuç: AI ajanları kodlamada insanları şimdiden geçti; kapsamı sınırlı debugging alanında da yakında geçmesi bekleniyor
- Ancak iyi mühendislik için gereken diğer kritik becerilerde AI hâlâ geride
- Uzun dönem bellek (long-term memory)
- Meta bellek (meta memory): neyi bilip neyi bilmediğini net biçimde ayırt edebilme yetisi
- Kanıtsal yeterlilik değerlendirmesi (Evidential Sufficiency Assessment): harekete geçmek için yeterli kanıt olup olmadığını değerlendirme
- Mevcut istatistiksel mimarilerin güçlendirilmesi veya başka bir atılımla değiştirilmesi gerekiyor
- Görev tamamlama kapasitesi ile AI özerkliği aynı şey değil
Maliyet kesişim noktası senaryosu
-
Temel karşılaştırma
- Düşük maliyetli ülkelerden mühendis + yeterince yetkin model kombinasyonunun, en üst frontier modellere kıyasla fiyat/performans açısından üstün hale geldiği zaman analiz ediliyor
- Değişkenler: mühendis maaşı, maaş artış oranı, başlangıç token miktarı, token artış oranı, frontier fiyatı, frontier fiyat değişim oranı, DeepSeek fiyatı, süre
-
Sonuç
- 11. ayda kesişim gerçekleşiyor; frontier çıkarım maliyeti, mühendis+DeepSeek kombinasyonunun maliyetini ($1,116.61/ay) aşıyor
Görüşler ve sınırlamalar
- Grafikte basitleştirici varsayımlar bulunuyor
- Gelecekteki çıkarım fiyatları, token tüketim trendleri gibi değişkenler
- Reflexivity: piyasa katılımcılarının gözlemlenen sonuçlara göre davranışlarını değiştirmesi
- Aşağıdaki unsurlar hesaba katılmadı; ancak dahil edilirse yerel modeller lehine daha da güçlü bir tablo çıkabilir
- Yerel modellerin hızlı performans artışı
- Önümüzdeki aylar ve yıllarda eklenecek ek çıkarım donanımı
- Temel tez şu: AI maliyetlerindeki artış, belirli bir seviyenin üzerinde şirketler için endişe verici bir nakit yakımı ve toplam harcamalarda büyük bir pay haline geliyor
- Bunun sonucunda frontier lab’lerin fiyat artışlarının boyutu ve hızına bir üst sınır oluşuyor
1 yorum
Hacker News görüşleri
LLM fiyatlarını tartışırken asıl mesele gözden kaçıyor. Abonelik tabanlı token fiyatları, API fiyatlarından 10 ila 40 kat daha ucuz; bu yüzden aylık 90 dolarlık Claude aboneliği, API token fiyatına çevrildiğinde neredeyse 1000 ila 4000 dolara denk geliyor
İkinci olarak, modeli kullanan “operatörün” becerisi sonuçlarda çok büyük fark yaratıyor. Promptları iyi yazan ve inisiyatifi yüksek deneyimli bir kıdemli geliştirici, motivasyonu ve temel yetkinliği zayıf bir ekip üyesinden çok daha iyi sonuç çıkarır
Son olarak, Opus gibi 5T seviyesindeki son teknoloji bir model ile, yalnızca benchmark'larda öne çıkan DeepSeek'in küçük distilled modelleri arasında yetenek, kararlılık ve hata ele alma açısından büyük fark var
Yani büyük şirketler, indirimli abonelik planlarından çok daha fazla ödüyor
Ayrıca yerel modellerin “DeepSeek'ten distilled” olduğu söylemi de yanlış görünüyor. Yerel modeller sadece benchmark'larda iyi görünmüyor ve Qwen 3.6 da oldukça iyi bir model. Elbette Opus değil ama çok daha hızlı, ayrıca hızın kendisi de bir kalite unsuru
Bu şirketler devasa zarar yazıyor ve yüzlerce milyar dolarlık borç ile taahhüt taşıyor. Çok yakında gelir elde etme musluğunu açmaları gerekecek
Bu, ağacı görüp ormanı kaçırmak gibi. ChatGPT ile çalışmak, eskiden enterprise döneminde Hindistan'daki offshore geliştiricilerle çalışmaya ürkütücü derecede benziyor. Açık yönlendirme yapılırsa verimli oluyor ama kendi haline bırakılınca bolca WTF anı yaşanıyor
LLM'lerin outsourcing geliştiricilerin yerini alma ihtimali yüksek. Çünkü bağlamı bilen iç ekip çalışanları, LLM'leri kullanarak eskiden offshore geliştiricilerin yaptığı işleri yapabilir
Şirketler her zaman marjinal maliyeti düşürmeye çalışır. ABD'de 1 yazılım mimarı tutup şartname yazdırır, Hindistan'da ise 10 geliştirici tutup 100 ajanı gözetmelerini sağlar
Uzaktan geliştiricilerden farklı olarak outsourcing’in sorunu, düzgün yürütmek için gerçekten çok iyi bir yöneticiye ve teknik lidere ihtiyaç duyulmasıdır.
Deneyimime göre etkili sonuç almak için çok ayrıntılı tasarım belgeleri ve iş tanımları yazmak gerekir. Genelde etkili bir prompt kadar ayrıntılı olmaları gerekir.
Bu kadar ayrıntılı bir spesifikasyonu zaten yazdıysan, neden outsourcing geliştiricilere ve en ileri modellere ihtiyaç duyasın?
Güçlü ürün/proje liderlerinin çok yakından denetlediği şirketler yeni bir geliştirici nesli yetiştirebilir, ama bazı şirketler satış söylemine inanıp yazılım bakım yapılamaz hale gelirken başarısız olacak.
10 yıl sonra da geliştirici sayısının bugünküne yakın olacağını ve daha fazla ürün üretiyor olacağımızı düşünüyorum. AI, anlamlı ve izole alanların otomasyonunda kullanılacak, ama yazılım geliştirmenin büyük kısmı aynı kavramları daha az metinsel çöp ile ifade eden daha yüksek bir soyutlama düzeyinde gerçekleşecek.
Kodun özü, tuhaf sınır durumlarının karmaşıklığını somut biçimde kodlamaya ve görünür kılmaya daha çok odaklanacak.
Yazılım geliştirmeye ilk başladığımda, birçok kişinin elinden geçmiş aşırı dağınık bir MUD üzerinde çalışmıştım. AI’ın sıkı denetim ve düzeltme olmadan ürettiği çamur yığını ve spaghetti kodu kimin gönüllü olarak kazımak isteyeceğini hayal etmek zor.
Yazılım geliştirmenin özü her zaman problem çözmekti, daha doğrusu problemi tespit etmekti. Zamanla bu noktaya odaklanabilmek için yan işleri giderek ayıkladık. Bu akış sürecek gibi görünüyor; problem tanımını yapan daha özlü ve soyut dillere evrilecek, zor mantık akışları, driver kısımları ve matematik ise kütüphaneler ve araçlarla daha fazla izole edilecek
Mühendisler işbirliğine açık olsa bile, yöneticiler ya da işletme sahipleri yakın işbirliğinden kaçınır ve mesafeli bir çalışma biçimini dayatır. Örneğin haftada bir görüşme gibi.
Bunu bizzat yaşadım. Bir keresinde outsourcing geliştirme ekibine £300k harcadık; neyse ki kendi param değildi ve sonunda hiçbir şey teslim alamadık. Zamanın çoğu sadece çalışma yönünü hizalamaya gitti.
Ben ve ortağım ne istediğimizi az çok biliyorduk ve çabaları hizalamak için daha sık senkron olmak istiyorduk, ama onların yöneticileri sürekli bunu engelledi. İşte danışmanlık iş modeli bu.
Uzaktan tam zamanlı çalışanlarda teşvikler tersinedir. Bunlar kelimenin tam anlamıyla tam zamanlı çalışandır, iletişimi engelleyen bir yönetim katmanı yoktur ve tembel ya da dolandırıcı değillerse ilginç problemleri çözmek isterler; sıkıcı biçimde oturmak istemezler
Bence orijinal metnin varsayımının saptığı nokta da burası. DeepSeek ile en ileri modeller arasındaki fark genelde düşük kaliteli outsourcing ile kapatılabilecek bir aralık değildir. Sonunda çok yetkin outsourcing mühendislerine para ödersin ve onlar da o kadar ucuz olmayabilir. Zaten outsourcing sadece maliyet yüzünden değil, yetkinlik ve kapasite nedeniyle de yapılır
Her şeyi uygun ayrıntı düzeyine kadar tanımlamak zorundasın ve o noktada LLM’nin de bunu oldukça iyi yapabilmesi muhtemel. Üstelik birçok outsourcing ekibi, iç ekipten tamamen farklı şekilde inşa eder ve teslimat kalitesiyle hız farkı mutlaktır.
Her şey bu kadar hızlı değişirken, neden başkasının çalışanlarını güncel akımlara göre eğitmek için kendi zamanımı ve paramı harcayayım diye de düşünüyorum
ABD’li bir yazılım şirketinde yönetici olan bir arkadaşım var; Doğu Avrupa ofisindeki birkaç programcı ekibini işten çıkarıp onların yerine az sayıda ABD’li programcı ve AI koymaya hazırlanıyor. Bunun çok daha üretken olduğunu ve yeni özellikleri çok daha hızlı geliştirdiğini söylüyor
Bunu imalata uygularsan, robot öncelikli strateji sadece imalatı ülkeye geri getirmekle sınırlı olmamalı; çıtayı daha yükseğe koymalı. Yeni outsourcing üretim merkezi olmak gibi
Bu yüzden KOBİ’lerin içeride bugün olduğu kadar çok mühendis, finans ve pazarlama personeli bulundurmasına gerek kalmayabilir
ABD’nin en ileri AI geleceği, API çağrıları değil; işi OAI/Anthropic’e bir danışman ya da dış firma gibi götürüp, aradaki işleri topluca hiç görmeden ürün benzeri sonuçlar almak olacak.
Bu, distillation tehdidi ile en ileri performansı zorlamak için gereken özel yürütme ortamı geliştirme çabasının birleşmesi nedeniyle kaçınılmaz.
OAI/Anthropic %100 herkesin işini elinden alıp “emeğe” sahip olmaya çalışacak. Burada iyi taraf Çin
Ama onların fark etmediği şey, tanımlama işinin çözümün kendisinden daha zor olduğudur
Yerel modelleri bir şekilde kullanabilmek için gerçekten çok denedim. Çeşitli çalışma ortamlarını, araçları, becerileri, prompt'ları ve daha fazlasını kullandım.
Ama Claude Code ve Anthropic modellerini ya da Codex ve GPT 5.5'i Qwen, GLM, Gemma gibi çalışma ortamlarında karşılaştırınca, en ileri düzey modeller ezici biçimde önde. Artık ileri düzey olmayan modellerin anlamını bilmiyorum. Tasarruf ettiğim zamandan çok boşa harcadığım zaman var
Dar kapsamlı kodlamada, örneğin belirli bir fonksiyon yazmada, yavaş olsa da mümkün. Yine de gelişmiş tüketici donanımında genel LLM sohbeti amacıyla kullanmak, maliyet dışında bakıldığında rekabetçi
https://www.williamangel.net/blog/2026/05/17/offline-llm-ene...
Çıkarım maliyeti düştükçe, son birkaç yılda olduğu gibi, bu yılın sonunda bugünün ileri düzey modellerini dizüstü bilgisayarda çalıştırabilir hale geleceğiz
Yazılım mühendisi olarak pratikte tamamını kullanmanın zor olduğu kadar yeterli ve verim artışı düşünülünce oldukça ucuz
Üstelik Claude/Codex zaten iyi iş çıkarıyor ve her ay daha da iyileşiyor; böyleyken kim çalışma ortamlarıyla uğraşmak ya da ajan orkestrasyonu tanımlamak ister ki
Daha olası senaryo, alt tarafın ortadan kalkması ve üst tarafın en ileri düzey modeller sayesinde daha üretken hale gelmesidir
Geliştirici ne kadar zayıfsa, o kadar yüksek yetenekli AI gerekir. Bu yazının öncülü, zayıf geliştirici ve zayıf AI'ın, güçlü geliştirici ve neredeyse otonom AI'dan daha iyi olduğu yanılgısına dayandığı için geçerli değil
En ileri düzey AI kullanan zayıf geliştiricinin ürettiği ürünler bile, iki yıl önceki zayıf AI'ı yanında kullanan yetkin geliştiriciden şimdiden daha kötü
Daha açık söylemek gerekirse, güçlü geliştiriciler iki yıl önce de AI'dan yararlanarak yüksek kaliteli ürünler yapabiliyordu. En yeni AI ile bile zayıf geliştiriciler hâlâ zorlanırken, güçlü geliştiriciler daha güçlü AI'a daha fazla işi devredip üretkenliklerini daha da artırabiliyor
Gözetimsiz sözleşmeliler ya da gereğinden fazla işe alınmış yeni mezunların bulunduğu kâbus gibi organizasyonlar, bugünlerde çok daha ölümcül olurdu
DeepSeek'i açık kaynak LLM örneği olarak gösteren anlatıyı sürekli görüyorum, ama onlar muazzam miktarda token'ı maliyetine sübvanse ediyor. Tembel olmayıp eleştirel düşünürseniz nedenini anlamak kolay
Özellikle jeopolitik riskler nedeniyle çıkarım donanımının ciddi biçimde kısıtlandığı bir ortamda, en ileri düzey modellerin sunduğu seviyeye yaklaşan bir yerel AI kullanmak hâlâ fazla pahalı ve verimsiz
Yerel LLM'lerin uzun vadede bu ileri düzey şirketleri tehdit edebileceği iddiasına da çok şüpheyle yaklaşıyorum
Token'ların pahalılaşmasının nedeni, onların pazarı ele geçirmeye başlaması ve bu üstünlüğü kullanarak sınırların içinde ve dışında donanım dağıtımını kısıtlayacak olmaları
Bazı iş akışlarında yerel LLM'ler daha fazla kullanılabilir, ancak bunlar ileri düzey model seviyesi gerektiren işler olmayacak ve ileri düzey modellerin daha hafif, daha küçük sürümlerinin uzun kuyruğu yakalamak için sunduğu fiyatlarla rekabet etmek de zor olacak
Benim izlenimim, DeepSeek'in v4'ü özellikle ucuz çıkarım için tasarladığı ve fiyatı %75 düşürse bile zarar etmediği yönünde
Mühendis maliyetinden daha önemli olanın kalite deneyimi ve kişisel değerler olduğunu düşünüyorum. Son birkaç yılda outsource işlerde çok fazla kestirme yol gördüm ve AI da kestirme yolları çok seviyor. İkisinin birleşimi, maliyet tasarrufu kadar değerli değil
Yüksek kaliteli işi ve yaptığı işle gurur duymayı önemsiyorsanız, outsource iş gücü çözüm değildir. Genelde kendi işlerine özenle dikkat etmedikleri için maliyetleri düşüktür
Buna karşılık, tek derdiniz bir şekilde bitirmek ve düzgün yapılıp yapılmadığını umursamamaksa, mümkün olduğunca az para harcamaktan daha iyi bir yöntem de olmayabilir
Yazının ele almadığı bir nokta var. İyi mühendisler mevcut projelerde zamanlarının büyük kısmını kodun kendisine harcamaz; başka işlere daha çok zaman gider. İyi mühendisler sistemi uçtan uca anlar. Offshore geliştirici, Llama3'ten bile kötüdür