- Teknik işlerde açık LLM tarafında hâlâ performans, uyumluluk ve güven maliyetleri var; ancak son dönemde aradaki fark daraldı ve Claude ya da GPT gibi kapalı modellere bağımlılığı azaltmak için alan büyüyor
- Geçmişte Linux, MS Office uyumluluğu, özel dosya biçimleri ve olgunlaşmamış açık kaynak ekosistemi nedeniyle profesyonel işlerde riskliydi; ancak web uygulamalarının yaygınlaşması ve ekosistemin olgunlaşmasıyla bu fedakârlıklar büyük ölçüde azaldı
- 21 Haziran 2026 itibarıyla Artificial Analysis intelligence leaderboard sıralamasının üst basamaklarında Claude ve GPT gibi kapalı API modelleri yer alıyor; Claude code ve başlıca API'ler kullanım kolaylığı ve kurum içi güven açısından hâlâ önde
- Açık modeller, sağlayıcının kendisi ya da OpenRouter gibi üçüncü taraflar üzerinden kullanılabiliyor; ancak gizlilik ve veri paylaşımı endişeleri var, doğrudan çalıştırıldıklarında ise mahremiyet iyileşse de maliyet, karmaşıklık ve hız yükü ortaya çıkıyor
- Claude'un ID verification uygulamasını devreye alması, üst seviye modelleri kullanmayı bırakmanın maliyetini yeniden düşündürdü; ancak açık modeller liderlerle arayı birkaç aya kadar kapatmış olduğundan, kısa vadeli üretkenlik kaybı belirleyici bir engel olmayabilir
Linux geçiş maliyeti açısından açık LLM'lerin bugünkü konumu
- Eskiden Linux kullanmak, teknik işlerde bile profesyonel risk yaratabiliyordu
- Word belgeleri ya da PowerPoint dosyaları düzgün render edilmeyebilirdi
- Open Office dışa aktarma sonuçlarına güvenmek zorunda kalınabilirdi
- Özel dosya biçimleri kolay açılamadığı için işbirliği zorlaşabilirdi
- Ana akım yazılımların özelliklerini yakalamaya çalışan açık kaynak projelerinde çok fazla pürüz vardı
- Bugün üretkenlik yazılımları çoğu zaman web uygulaması olarak sunuluyor ve Linux ile açık kaynak yazılımlar olgunlaşarak aradaki farkı daralttı
- CAD gibi belirli alanlardaki yazılımlar için Windows hâlâ gerekli olabilir
- Yine de Linux ve açık kaynak artık eskisi gibi genel iş akışlarında büyük fedakârlıklar gerektirmiyor
Açık model kullanıcılarının katlanması gereken maliyetler
- Açık LLM kullanıcıları için hâlâ net bir bedel var
- 21 Haziran 2026 itibarıyla Artificial Analysis intelligence leaderboard sıralamasında Claude ve GPT üst sıralarda
- Yalnızca performansta değil, uyumluluk ve kullanım kolaylığında da Claude code ve başlıca API'ler güçlü
- LLM sorgularını OpenAI ve Anthropic'e göndermek, birçok kişinin kabul ettiği bir güven seviyesine ulaşmış durumda
- Açık modelleri API üzerinden kullanma yolunda güven sorunu eşlik ediyor
- Model, sağlayıcının kendisi tarafından ya da OpenRouter gibi üçüncü taraflarca servis edilebilir
- İstemci verisi ya da gizli veri içeren API çağrılarını göndermede gizlilik ve veri paylaşımı açısından daha fazla tedirginlik var
- Deepseek ya da OpenRouter'a istek göndermek, gerçek riskten bağımsız olarak daha fazla kaygı yaratabilir
- Doğrudan çalıştırmak gizlilik sorununu azaltır, ancak maliyet, karmaşıklık ve hız yükü getirir
- Yerelde veya bulutta çalıştırılabilir
- Doğrudan çalıştırma; pahalı, karmaşık ya da görece yavaş olma sorunlarından en az ikisini beraberinde getirir
Claude kimlik doğrulamasının yarattığı geçiş eşiği
- Claude'un identity verification özelliğini devreye alması, geçiş kararını öne çekti
- Son modellerdeki yeni korumalar (safeguards) ve Mythos ile ilgili durum da kullanıcı deneyiminin kötüleşeceğine dair bir işaret olarak görülüyor
- ID verification kabul edilmediğinde, üst seviye modelleri bırakmanın mesleki kaybı temel sorun olarak kalıyor
- Açık modellere geçiş, 2008'deki Linux ve Windows arasındaki farktan çok daha yakın bir durumda değerlendiriliyor
- Yerelde ya da bulutta birden fazla açık modeli çalıştırabilecek ortam zaten var
- Açık modeller için kodlama harness'ları da mevcut
- Açık modeller lider modellerle çok yaklaştı ve genelde yalnızca birkaç ay geriden geliyor
- Üretkenlik kısa vadede düşebilir, ancak araştırma döneminde Matlab'dan GNU Octave'a geçmekte olduğu gibi bunun belirleyici bir engel olmadığı düşünülüyor
1 yorum
Hacker News görüşleri
Tüm isteklerde eurouter.ai üzerinde aşağıdaki yönlendirme kurallarını kullanmamın nedeni tam olarak bu
Pahalı ama en azından hukuki açıdan veri gizliliğinin garanti altında olduğunu düşünüyorum. Anthropic, OpenAI ve OpenRouter'a kıyasla buna daha çok güveniyorum
Şahsen ABD merkezli yapay zeka araçlarını kullanmayı ahlaken kabul etmekte zorlanıyorum ve onlara para ödeyerek karıştıkları suçları desteklemek istemiyorum[1]
[1]: https://news.ycombinator.com/item?id=48512339
Anthropic için kırmızı çizgi olan nokta “of Americans” ifadesi. O zaman medeni dünyanın geri kalanına istediklerini yapmaları sorun değil mi? ABD dışındaki müttefik ülkeleri makine öğreniminde manipüle edilmiş testler ya da veri sızıntılarıyla istikrarsızlaştırmaları kabul edilebilir mi diye düşündürüyor
Daha da tuhaf olan, modelin https://www.anthropic.com/constitution metnine uyduğunu ve bunun modele yerleşik olduğunu iddia etmeleri. Ama Claude Code ve cowork için sistem prompt'ları bu maddeleri tekrar tekrar sıralıyor. Gerçekten yerleşikse buna gerek olmaması gerekir
API sürümündeki Claude'a yeterince prompt engineering uygulanırsa Hitler yanlısı gibi davranmasını sağlamak mümkün ve bu da kendi iddialarıyla doğrudan çelişiyor. Özellikle Opus 4.7, belirli azınlık gruplarını hedef alan propaganda metinleri bile isteyerek üretti; ancak 4.8'de henüz aynı başarıyı görmedim. Bu aralar daha çok modelin siber yeteneklerinin kötüye kullanımıyla ilgilendiğim için o yöne derinlemesine gitmedim
En başından beri vardığım sonuç, Anthropic'in stratejisinin tamamen imaj yönetimi olduğuydu; şirkete gelen destek seline bakılırsa bunda epey başarılı olmuşlar
eurouter.ai'ye baktım ve teklifin kendisi oldukça kötü görünüyor
Ücretsiz hesapta %15 fiyat farkı alınması da mantıksız ve aylık 40€ ödemezseniz ayda 1000 istek sınırı var. Ama tam olarak nasıl bir değer sunduğunu anlayamadım
DeepSeek-V4-Pro için yalnızca TensorX adında tek bir sağlayıcı var ve cache read maliyeti DeepSeek'ten 100 kattan fazla pahalı ($0.44 vs $0.003625). Özellikle eurouter.ai üzerinde cache token maliyeti bilgisini bulamadığım için TensorX'in sitesine kadar bakmak zorunda kaldım
“Suç” demek bile yetersiz kalıyor
“AI-assisted targeting in the Gaza Strip” - https://en.wikipedia.org/wiki/AI-assisted_targeting_in_the_G...
“Palantir allegedly enables Israel's AI targeting in Gaza, raising concerns over war crimes” - https://www.business-humanrights.org/de/neuste-meldungen/pal...
“What The Wounds Are Telling Us” - https://www.volkskrant.nl/kijkverder/v/2025/gunshot-palestin...
OpenRouter için başka alternatifleri merak edip biraz araştırdım
EURouter(Amsterdam): https://www.eurouter.ai/pricing
Eden AI(Fransa): https://www.edenai.co/pricing
nexos.ai(Litvanya): https://nexos.ai/pricing/
Requesty(Almanya): https://www.requesty.ai/pricing
Cortecs(Avusturya): https://cortecs.ai/pricing
Nordference(Estonya): https://nordference.ai/pricing
Gerçekten mantar gibi çoğalıyor gibiler. Hiçbirini bizzat kullanmadım, dolayısıyla herhangi birini tavsiye ediyor değilim; ama ihtiyacı olanlar için seçenekler var gibi görünüyor
Eğer asıl endişe gerçekten veri güvenliği ise, sonunda buna katlanıp kendi kendine barındırmak dışında bir çözüm yok gibi görünüyor
İnsanların açık ağırlıklı modelleri, kapalı modellere göre “birkaç ay geriden geliyor” diye elemesini ilginç buluyorum
LLM gelişiminin inanılmaz hızlı olduğunu biliyorum ama birkaç ay önceki Opus ve GPT gerçekten bugünkü açık ağırlıklı modeller seviyesindeyse, geçmemek için bir neden yok. Özellikle de birkaç ay önceden beri o modelleri kullanan biriyseniz daha da yok
Kod tabanı değişmiş de değil, o yüzden açık ağırlıklı modeli kullanabilirsiniz. Kaleyi yerinden oynatmamak lazım
Bu yüzden Kimi-2.7, GLM-5.2, Deepseek-v4 kullanmakta hiçbir sorun yok. Tavan noktasına zaten epey yaklaştık ve artık iyileştirmelerin çoğu, muhakeme ya da tool calling’i biraz daha iyi yapan harness iyileştirmelerinden ve biraz daha iyi reinforcement learning’den geliyor gibi görünüyor
En iyi açık ağırlıklı modelin bile birkaç ay önceki Opus ile aynı olduğundan hâlâ emin değilim. Benchmark’ların ne dediğini biliyorum ve beklentim de yüksekti ama gerçek kullanım deneyimi benchmark’larla örtüşmedi
Opus 4.8’in bile zorlandığı çok iş yapıyorum. En ileri LLM’ler bile henüz tam olarak o seviyeye ulaşmamışken, daha gerideki modellere geçmek için bir motivasyon oluşmuyor
Hendek o kadar düz ki verdiği şey sadece +1 gıda, +1 üretim. Yol varsa +1 altın
Bu modellerin şaşırtıcı yanı, interneti fiilen yerel makineye sığabilecek bir biçime damıtıp üzerine doğal dille sorgu atabilmeniz
Teknoloji ve donanım, damıtılması gereken bilgi tabanının büyüme hızından daha hızlı iyileşiyor; bu yüzden işe yarar yerel modellerin mümkün hale gelmesi kaçınılmaz görünüyor
Bu yazının tavrı bana epey şaşırtıcı geliyor. Bir yandan Linux ve diğer özgür/açık kaynak yazılımları benimseme hikâyesiyle başlıyor; oysa FOSS’un özü, kullanıcının çalıştırdığı yazılımı anlayıp değiştirebilmesini sağlamaktır
Ama geri kalanı, yazarın ne değiştirebildiği ne de anlayabildiği araçlar olan LLM’leri kullanma hikâyesi. Devasa kayan nokta matrisleri en iyi ihtimalle derlenmiş koda benzetilebilir; hatta pratikte bazen kapalı kaynak yazılımı decompile edip anlamak daha kolay oluyor
Üstelik çoğu durumda “açık” modeli çalıştırmaya kalksanız bile altından kalkması zor donanım gerekiyor. Yazılım özgürlüğünü öven bir yer buraya nasıl geldi, bilmiyorum
Başlık kesin konuşuyor ama gövdede “en aza insin istiyorum” deniyor
Birden fazla abonelik kullanıyorum, OpenRouter üzerinden farklı LLM sağlayıcılarını token bazında deniyorum, açık ağırlıklı modelleri de yerelde çalıştırıyorum
Şimdilik katılmak zor. Anthropic ve OpenAI modelleri gerçekten diğerlerinden çok daha iyi. Açık ağırlıklı modeller genel olarak benchmark optimizasyonuna fazla abanmış gibi duruyor ve gerçek deneyim, benchmark’ların ima ettiğinden çok farklı
Bunu söylediğimde, insanlar şu an duymak istediği gerçek bu olmadığı için sık sık downvote yiyorum ama karmaşık işlerde durum bu
Yetenekli bir kullanıcının elinde, kolay işlerin önemli bir kısmı açık ağırlıklı modellerle gayet yapılabilir bence. Biraz gözetimle junior birine verilebilecek iş düzeyindeyse, hangi model olursa olsun yapar
Ama benim yaptığım işlerin çoğunda Opus 4.8 Max bile sürekli dikkatle izlenmeyi, yön verilmeyi ve gözden geçirilmeyi gerektiriyor. Fable da öyleydi ama daha düşük ölçüde
Büyük açık ağırlıklı modelleri denediğinizde, yerelde katlanılabilir kuantizasyon seviyesinde makul hız alamadığınız için hosting’e yöneliyorsunuz; büyük işlerdeyse sonunda muhtemelen çöpe gidecek çıktıyı beklerken token yakmak daha da uzun sürüyormuş gibi geliyor. Keşke o seviyeye gelmiş olsak ama henüz değil
Claude, 4.6 seviyesine geldikten sonra kodlama için kullanılabilir olmaya başladı. Sonrasında da hoş ek özellikler geldi ama 4.6 Sonnet ve Opus açık ağırlıklı olsaydı, fazlasına ihtiyaç kalmazdı gibi geliyor
Fable’ı biraz kullanınca bu düşüncem daha da güçlendi
Yerel inference’a daha alışkın olmak istiyordum ama donanımım yok; bu yüzden pek tartışıldığını görmediğim bir şey olarak yerel kooperatif fikrini düşünmeye başladım
Ekonomik açıdan bakınca, birkaç kişinin bir araya gelip iyi donanım ve açık modeller işletmesi mantıklı olabilir gibi duruyor ama böyle bir tartışmaya hiç rastlamadım. Acaba benim kaçırdığım bir şey mi var diye düşünüyorum
Böyle bir yapıya katılmak isteyen insanların birbirini bulmasına yardımcı olacak bir hizmet kurmak oldukça güzel olabilir
Şu anda bile /r/localllama üst sıralarında tam bu hesapla ilgili bir gönderi var: https://www.reddit.com/r/LocalLLaMA/comments/1ubrcwj/tokenom...
Özeti şu: GLM 5.2 çalıştırmak için minimum yaklaşık 20 bin dolar gerekiyor ve bulut barındırmalı sürüme kıyasla can sıkacak kadar yavaş olacak. Sunucunun 7/24 token hesapladığı varsayımında bile başa baş noktasına gelmek yıllar sürüyor
Yerelde çalıştırmak için tek neden, tam veri gizliliğinin en yüksek öncelik olması. Bunun için ciddi bir prim ödemiş oluyorsunuz
Doğru ama OpenAI da aynı fiyatta. OpenAI aylık 20 dolarken z.ai'ye neden ayda 18 dolar ödeyeyim ki?
Buna karşılık Z.ai Lite (aylık 18 dolar), GLM 5.2 için en kötü durumda yaklaşık 80 istek sunuyor. Bu yoğun olmayan saatlere göre; yoğun saatler New York saatiyle sabah 2-6 arası. Bu yüzden Z.ai daha düşük fiyata daha yüksek limit verebiliyor
(https://codeberg.org/mutablecc/calculate-ai-cost/src/branch/...)
Linux açıkça yetenekliydi ama kullanımı rahat hale getirmek için hack'ler ve ek çaba gerektiği dönemlerde, asi biri gibi Linux kullanmak daha kolaydı
Ama benim deneyimime göre açık modeller, yetenek ya da operasyon gereksinimleri açısından henüz o noktaya gelmedi. GLM5.2 yetenekli görünüyor ama onu o kadar yetenekli şekilde çalıştırmak için devasa bir GPU kümesi gerekir
Açık bir modele barındırılan API üzerinden erişecekseniz, bu barındırılan API üzerinden kapalı bir model kullanmaktan farksız hale geliyor. 15 yıl önce Linux kullanmakla karşılaştırınca teşvik yapısı çöküyor
Yanlış anlaşılmak istemem. Yerelde model çalıştırıp memnun olmak isterdim ama şu an değil
Mesele, bunun tek bir aktör tarafından kontrol edilmemesi ve bu yüzden enshittification'a maruz bırakılamamanız. Bu zaten oldu, şimdi de oluyor, gelecekte de olacak
Ağırlıkları açık bir modelse kolayca kovulmaz, kilitlenmez ya da erişiminiz kesilmez. Bir şirket bunu yapmaya kalksa bile sunucu çiftlikleri olan başka biri sizi müşteri olarak kabul edebilir ve iş akışınızda değişecek tek şey API URL'si ile anahtar olur
Aynı karaktere ve aynı bilgiye sahip aynı modelle konuşmaya devam edersiniz
Yazının genel yönüne kısmen katılıyorum ama iki nokta var
Birincisi, benim testlerimde açık modeller henüz yazılım geliştirme, mühendislik ve bunlara komşu işlerde en azından Claude Opus ile boy ölçüşecek seviyede değildi
İkincisi, sürdüğü sürece tadını çıkarın. Bu yılın sonlarına doğru güvenlik bahanesiyle bu açık modellerin “yasadışı” ilan edilmemesine gerçekten şaşırırım. Burada bahane diyorum çünkü asıl itici güç düzenleyici ele geçirme ve sanayi korumacılığı olacaktır