1 puan yazan GN⁺ 5 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Teknik işlerde açık LLM tarafında hâlâ performans, uyumluluk ve güven maliyetleri var; ancak son dönemde aradaki fark daraldı ve Claude ya da GPT gibi kapalı modellere bağımlılığı azaltmak için alan büyüyor
  • Geçmişte Linux, MS Office uyumluluğu, özel dosya biçimleri ve olgunlaşmamış açık kaynak ekosistemi nedeniyle profesyonel işlerde riskliydi; ancak web uygulamalarının yaygınlaşması ve ekosistemin olgunlaşmasıyla bu fedakârlıklar büyük ölçüde azaldı
  • 21 Haziran 2026 itibarıyla Artificial Analysis intelligence leaderboard sıralamasının üst basamaklarında Claude ve GPT gibi kapalı API modelleri yer alıyor; Claude code ve başlıca API'ler kullanım kolaylığı ve kurum içi güven açısından hâlâ önde
  • Açık modeller, sağlayıcının kendisi ya da OpenRouter gibi üçüncü taraflar üzerinden kullanılabiliyor; ancak gizlilik ve veri paylaşımı endişeleri var, doğrudan çalıştırıldıklarında ise mahremiyet iyileşse de maliyet, karmaşıklık ve hız yükü ortaya çıkıyor
  • Claude'un ID verification uygulamasını devreye alması, üst seviye modelleri kullanmayı bırakmanın maliyetini yeniden düşündürdü; ancak açık modeller liderlerle arayı birkaç aya kadar kapatmış olduğundan, kısa vadeli üretkenlik kaybı belirleyici bir engel olmayabilir

Linux geçiş maliyeti açısından açık LLM'lerin bugünkü konumu

  • Eskiden Linux kullanmak, teknik işlerde bile profesyonel risk yaratabiliyordu
    • Word belgeleri ya da PowerPoint dosyaları düzgün render edilmeyebilirdi
    • Open Office dışa aktarma sonuçlarına güvenmek zorunda kalınabilirdi
    • Özel dosya biçimleri kolay açılamadığı için işbirliği zorlaşabilirdi
    • Ana akım yazılımların özelliklerini yakalamaya çalışan açık kaynak projelerinde çok fazla pürüz vardı
  • Bugün üretkenlik yazılımları çoğu zaman web uygulaması olarak sunuluyor ve Linux ile açık kaynak yazılımlar olgunlaşarak aradaki farkı daralttı
    • CAD gibi belirli alanlardaki yazılımlar için Windows hâlâ gerekli olabilir
    • Yine de Linux ve açık kaynak artık eskisi gibi genel iş akışlarında büyük fedakârlıklar gerektirmiyor

Açık model kullanıcılarının katlanması gereken maliyetler

  • Açık LLM kullanıcıları için hâlâ net bir bedel var
    • 21 Haziran 2026 itibarıyla Artificial Analysis intelligence leaderboard sıralamasında Claude ve GPT üst sıralarda
    • Yalnızca performansta değil, uyumluluk ve kullanım kolaylığında da Claude code ve başlıca API'ler güçlü
    • LLM sorgularını OpenAI ve Anthropic'e göndermek, birçok kişinin kabul ettiği bir güven seviyesine ulaşmış durumda
  • Açık modelleri API üzerinden kullanma yolunda güven sorunu eşlik ediyor
    • Model, sağlayıcının kendisi tarafından ya da OpenRouter gibi üçüncü taraflarca servis edilebilir
    • İstemci verisi ya da gizli veri içeren API çağrılarını göndermede gizlilik ve veri paylaşımı açısından daha fazla tedirginlik var
    • Deepseek ya da OpenRouter'a istek göndermek, gerçek riskten bağımsız olarak daha fazla kaygı yaratabilir
  • Doğrudan çalıştırmak gizlilik sorununu azaltır, ancak maliyet, karmaşıklık ve hız yükü getirir
    • Yerelde veya bulutta çalıştırılabilir
    • Doğrudan çalıştırma; pahalı, karmaşık ya da görece yavaş olma sorunlarından en az ikisini beraberinde getirir

Claude kimlik doğrulamasının yarattığı geçiş eşiği

  • Claude'un identity verification özelliğini devreye alması, geçiş kararını öne çekti
    • Son modellerdeki yeni korumalar (safeguards) ve Mythos ile ilgili durum da kullanıcı deneyiminin kötüleşeceğine dair bir işaret olarak görülüyor
    • ID verification kabul edilmediğinde, üst seviye modelleri bırakmanın mesleki kaybı temel sorun olarak kalıyor
  • Açık modellere geçiş, 2008'deki Linux ve Windows arasındaki farktan çok daha yakın bir durumda değerlendiriliyor
    • Yerelde ya da bulutta birden fazla açık modeli çalıştırabilecek ortam zaten var
    • Açık modeller için kodlama harness'ları da mevcut
    • Açık modeller lider modellerle çok yaklaştı ve genelde yalnızca birkaç ay geriden geliyor
    • Üretkenlik kısa vadede düşebilir, ancak araştırma döneminde Matlab'dan GNU Octave'a geçmekte olduğu gibi bunun belirleyici bir engel olmadığı düşünülüyor

1 yorum

 
GN⁺ 5 시간 전
Hacker News görüşleri
  • Tüm isteklerde eurouter.ai üzerinde aşağıdaki yönlendirme kurallarını kullanmamın nedeni tam olarak bu

    {  
    "model": "glm-5.2",  
    "models": [  
    "deepseek-v4-pro",  
    "deepseek-v4-flash"  
    ],  
    "provider": {  
    "allow_fallbacks": true,  
    "data_collection": "deny",  
    "data_residency": "EU",  
    "max_retention_days": 0,  
    "eu_owned": true  
    }  
    }  
    

    Pahalı ama en azından hukuki açıdan veri gizliliğinin garanti altında olduğunu düşünüyorum. Anthropic, OpenAI ve OpenRouter'a kıyasla buna daha çok güveniyorum
    Şahsen ABD merkezli yapay zeka araçlarını kullanmayı ahlaken kabul etmekte zorlanıyorum ve onlara para ödeyerek karıştıkları suçları desteklemek istemiyorum[1]
    [1]: https://news.ycombinator.com/item?id=48512339

  • Anthropic için kırmızı çizgi olan nokta “of Americans” ifadesi. O zaman medeni dünyanın geri kalanına istediklerini yapmaları sorun değil mi? ABD dışındaki müttefik ülkeleri makine öğreniminde manipüle edilmiş testler ya da veri sızıntılarıyla istikrarsızlaştırmaları kabul edilebilir mi diye düşündürüyor
    Daha da tuhaf olan, modelin https://www.anthropic.com/constitution metnine uyduğunu ve bunun modele yerleşik olduğunu iddia etmeleri. Ama Claude Code ve cowork için sistem prompt'ları bu maddeleri tekrar tekrar sıralıyor. Gerçekten yerleşikse buna gerek olmaması gerekir
    API sürümündeki Claude'a yeterince prompt engineering uygulanırsa Hitler yanlısı gibi davranmasını sağlamak mümkün ve bu da kendi iddialarıyla doğrudan çelişiyor. Özellikle Opus 4.7, belirli azınlık gruplarını hedef alan propaganda metinleri bile isteyerek üretti; ancak 4.8'de henüz aynı başarıyı görmedim. Bu aralar daha çok modelin siber yeteneklerinin kötüye kullanımıyla ilgilendiğim için o yöne derinlemesine gitmedim
    En başından beri vardığım sonuç, Anthropic'in stratejisinin tamamen imaj yönetimi olduğuydu; şirkete gelen destek seline bakılırsa bunda epey başarılı olmuşlar

  • eurouter.ai'ye baktım ve teklifin kendisi oldukça kötü görünüyor
    Ücretsiz hesapta %15 fiyat farkı alınması da mantıksız ve aylık 40€ ödemezseniz ayda 1000 istek sınırı var. Ama tam olarak nasıl bir değer sunduğunu anlayamadım
    DeepSeek-V4-Pro için yalnızca TensorX adında tek bir sağlayıcı var ve cache read maliyeti DeepSeek'ten 100 kattan fazla pahalı ($0.44 vs $0.003625). Özellikle eurouter.ai üzerinde cache token maliyeti bilgisini bulamadığım için TensorX'in sitesine kadar bakmak zorunda kaldım

  • “Suç” demek bile yetersiz kalıyor
    “AI-assisted targeting in the Gaza Strip” - https://en.wikipedia.org/wiki/AI-assisted_targeting_in_the_G...
    “Palantir allegedly enables Israel's AI targeting in Gaza, raising concerns over war crimes” - https://www.business-humanrights.org/de/neuste-meldungen/pal...
    “What The Wounds Are Telling Us” - https://www.volkskrant.nl/kijkverder/v/2025/gunshot-palestin...

  • OpenRouter için başka alternatifleri merak edip biraz araştırdım
    EURouter(Amsterdam): https://www.eurouter.ai/pricing
    Eden AI(Fransa): https://www.edenai.co/pricing
    nexos.ai(Litvanya): https://nexos.ai/pricing/
    Requesty(Almanya): https://www.requesty.ai/pricing
    Cortecs(Avusturya): https://cortecs.ai/pricing
    Nordference(Estonya): https://nordference.ai/pricing
    Gerçekten mantar gibi çoğalıyor gibiler. Hiçbirini bizzat kullanmadım, dolayısıyla herhangi birini tavsiye ediyor değilim; ama ihtiyacı olanlar için seçenekler var gibi görünüyor

  • Eğer asıl endişe gerçekten veri güvenliği ise, sonunda buna katlanıp kendi kendine barındırmak dışında bir çözüm yok gibi görünüyor

  • İnsanların açık ağırlıklı modelleri, kapalı modellere göre “birkaç ay geriden geliyor” diye elemesini ilginç buluyorum
    LLM gelişiminin inanılmaz hızlı olduğunu biliyorum ama birkaç ay önceki Opus ve GPT gerçekten bugünkü açık ağırlıklı modeller seviyesindeyse, geçmemek için bir neden yok. Özellikle de birkaç ay önceden beri o modelleri kullanan biriyseniz daha da yok
    Kod tabanı değişmiş de değil, o yüzden açık ağırlıklı modeli kullanabilirsiniz. Kaleyi yerinden oynatmamak lazım

    • Yeni kapalı modeller her seferinde “çığır açıcı” diye ve “diğer modellerin çözemediği X işi çözdü” diye pazarlanıyor ama bir ay sonra önceki neslin vasat modeli diye anılıyor
      Bu yüzden Kimi-2.7, GLM-5.2, Deepseek-v4 kullanmakta hiçbir sorun yok. Tavan noktasına zaten epey yaklaştık ve artık iyileştirmelerin çoğu, muhakeme ya da tool calling’i biraz daha iyi yapan harness iyileştirmelerinden ve biraz daha iyi reinforcement learning’den geliyor gibi görünüyor
    • Açık modellerle çok deney yaptım ama “sadece birkaç ay geriden geliyor” lafından yoruldum
      En iyi açık ağırlıklı modelin bile birkaç ay önceki Opus ile aynı olduğundan hâlâ emin değilim. Benchmark’ların ne dediğini biliyorum ve beklentim de yüksekti ama gerçek kullanım deneyimi benchmark’larla örtüşmedi
      Opus 4.8’in bile zorlandığı çok iş yapıyorum. En ileri LLM’ler bile henüz tam olarak o seviyeye ulaşmamışken, daha gerideki modellere geçmek için bir motivasyon oluşmuyor
    • Şu an bu yazıyı HN’de okuyor olmamın tek sebebi Anthropic API kesintisi, bu da self-hosting tarafına bir oy daha yazıyor
    • “Birkaç ay geriden geliyor” demekten biraz daha doğru ifade etmek gerekirse, önemli eşik muhtemelen 2025 24 Kasım’daki Claude Opus 4.5 öncesi mi sonrası mı olduğu. Noel’de OpenClaw çılgınlığını başlatan model oydu
    • Şirkette Deepseek V4 flash sağlayıcısı kullanıyoruz; gerçekten çalışan işlerin %95’ini maliyetin onda birine hallediyor. Daha güçlü modeli ara sıra devreye alıyoruz ama onu da bir kez daha düşündükten sonra
      Hendek o kadar düz ki verdiği şey sadece +1 gıda, +1 üretim. Yol varsa +1 altın
  • Bu modellerin şaşırtıcı yanı, interneti fiilen yerel makineye sığabilecek bir biçime damıtıp üzerine doğal dille sorgu atabilmeniz
    Teknoloji ve donanım, damıtılması gereken bilgi tabanının büyüme hızından daha hızlı iyileşiyor; bu yüzden işe yarar yerel modellerin mümkün hale gelmesi kaçınılmaz görünüyor

  • Bu yazının tavrı bana epey şaşırtıcı geliyor. Bir yandan Linux ve diğer özgür/açık kaynak yazılımları benimseme hikâyesiyle başlıyor; oysa FOSS’un özü, kullanıcının çalıştırdığı yazılımı anlayıp değiştirebilmesini sağlamaktır
    Ama geri kalanı, yazarın ne değiştirebildiği ne de anlayabildiği araçlar olan LLM’leri kullanma hikâyesi. Devasa kayan nokta matrisleri en iyi ihtimalle derlenmiş koda benzetilebilir; hatta pratikte bazen kapalı kaynak yazılımı decompile edip anlamak daha kolay oluyor
    Üstelik çoğu durumda “açık” modeli çalıştırmaya kalksanız bile altından kalkması zor donanım gerekiyor. Yazılım özgürlüğünü öven bir yer buraya nasıl geldi, bilmiyorum

  • Başlık kesin konuşuyor ama gövdede “en aza insin istiyorum” deniyor
    Birden fazla abonelik kullanıyorum, OpenRouter üzerinden farklı LLM sağlayıcılarını token bazında deniyorum, açık ağırlıklı modelleri de yerelde çalıştırıyorum
    Şimdilik katılmak zor. Anthropic ve OpenAI modelleri gerçekten diğerlerinden çok daha iyi. Açık ağırlıklı modeller genel olarak benchmark optimizasyonuna fazla abanmış gibi duruyor ve gerçek deneyim, benchmark’ların ima ettiğinden çok farklı
    Bunu söylediğimde, insanlar şu an duymak istediği gerçek bu olmadığı için sık sık downvote yiyorum ama karmaşık işlerde durum bu
    Yetenekli bir kullanıcının elinde, kolay işlerin önemli bir kısmı açık ağırlıklı modellerle gayet yapılabilir bence. Biraz gözetimle junior birine verilebilecek iş düzeyindeyse, hangi model olursa olsun yapar
    Ama benim yaptığım işlerin çoğunda Opus 4.8 Max bile sürekli dikkatle izlenmeyi, yön verilmeyi ve gözden geçirilmeyi gerektiriyor. Fable da öyleydi ama daha düşük ölçüde
    Büyük açık ağırlıklı modelleri denediğinizde, yerelde katlanılabilir kuantizasyon seviyesinde makul hız alamadığınız için hosting’e yöneliyorsunuz; büyük işlerdeyse sonunda muhtemelen çöpe gidecek çıktıyı beklerken token yakmak daha da uzun sürüyormuş gibi geliyor. Keşke o seviyeye gelmiş olsak ama henüz değil

    • Örnek var mı?
  • Claude, 4.6 seviyesine geldikten sonra kodlama için kullanılabilir olmaya başladı. Sonrasında da hoş ek özellikler geldi ama 4.6 Sonnet ve Opus açık ağırlıklı olsaydı, fazlasına ihtiyaç kalmazdı gibi geliyor
    Fable’ı biraz kullanınca bu düşüncem daha da güçlendi

  • Yerel inference’a daha alışkın olmak istiyordum ama donanımım yok; bu yüzden pek tartışıldığını görmediğim bir şey olarak yerel kooperatif fikrini düşünmeye başladım
    Ekonomik açıdan bakınca, birkaç kişinin bir araya gelip iyi donanım ve açık modeller işletmesi mantıklı olabilir gibi duruyor ama böyle bir tartışmaya hiç rastlamadım. Acaba benim kaçırdığım bir şey mi var diye düşünüyorum
    Böyle bir yapıya katılmak isteyen insanların birbirini bulmasına yardımcı olacak bir hizmet kurmak oldukça güzel olabilir

    • Bunun pek görülmemesinin nedeni, insanların hesap yapıp iyi bir anlaşma olmadığını fark ederek vazgeçmesi
      Şu anda bile /r/localllama üst sıralarında tam bu hesapla ilgili bir gönderi var: https://www.reddit.com/r/LocalLLaMA/comments/1ubrcwj/tokenom...
      Özeti şu: GLM 5.2 çalıştırmak için minimum yaklaşık 20 bin dolar gerekiyor ve bulut barındırmalı sürüme kıyasla can sıkacak kadar yavaş olacak. Sunucunun 7/24 token hesapladığı varsayımında bile başa baş noktasına gelmek yıllar sürüyor
      Yerelde çalıştırmak için tek neden, tam veri gizliliğinin en yüksek öncelik olması. Bunun için ciddi bir prim ödemiş oluyorsunuz
    • Açık modelleri çok düşük ücretlerle sunan birçok yer var. Genel olarak, farklı sağlayıcılardaki çeşitli metrikleri izleyen OpenRouter’a bakmanızı öneririm
    • https://news.ycombinator.com/item?id=48524387
    • Bulutta barındırılan açık modeller???
  • Doğru ama OpenAI da aynı fiyatta. OpenAI aylık 20 dolarken z.ai'ye neden ayda 18 dolar ödeyeyim ki?

    • Benim gördüğüm büyük bir avantaj, insanların modele bağlanması. Ben de buna dahilim. Açık modellerde, size kusursuz uyan bir model bulduysanız ve sonraki sürüm hoşunuza gitmezse, eski sürümü sonsuza kadar çalıştırabilirsiniz. Bunu ya kendiniz yaparsınız ya da sizin yerinize biri yapar
    • Bir neden istek limiti olabilir. OpenAI'nin ChatGPT Plus w/Codex'i (aylık 20 dolar), en kötü durumda 5 saatlik istek limiti olarak GPT-5.5 için 15, GPT-5.4 için 20, GPT-5.4-Mini için 60 istek veriyor
      Buna karşılık Z.ai Lite (aylık 18 dolar), GLM 5.2 için en kötü durumda yaklaşık 80 istek sunuyor. Bu yoğun olmayan saatlere göre; yoğun saatler New York saatiyle sabah 2-6 arası. Bu yüzden Z.ai daha düşük fiyata daha yüksek limit verebiliyor
      (https://codeberg.org/mutablecc/calculate-ai-cost/src/branch/...)
    • https://news.ycombinator.com/item?id=48618455
    • OpenCode Go aylık 10 dolar ve limitleri bunlardan ya da Codex'ten çok daha cömert
    • Fiyat sayfasında artık açıkça yazmıyor gibi görünüyor ama z.ai kodlama planı eskiden aynı fiyat bandındaki Claude planından 3 kat daha fazla kullanım sunduğunu iddia ediyordu. Bunun ne kadar doğru olduğunu bilmiyorum ama yalnızca API fiyatlarına bakınca bile GLM çok daha ucuz
  • Linux açıkça yetenekliydi ama kullanımı rahat hale getirmek için hack'ler ve ek çaba gerektiği dönemlerde, asi biri gibi Linux kullanmak daha kolaydı
    Ama benim deneyimime göre açık modeller, yetenek ya da operasyon gereksinimleri açısından henüz o noktaya gelmedi. GLM5.2 yetenekli görünüyor ama onu o kadar yetenekli şekilde çalıştırmak için devasa bir GPU kümesi gerekir
    Açık bir modele barındırılan API üzerinden erişecekseniz, bu barındırılan API üzerinden kapalı bir model kullanmaktan farksız hale geliyor. 15 yıl önce Linux kullanmakla karşılaştırınca teşvik yapısı çöküyor
    Yanlış anlaşılmak istemem. Yerelde model çalıştırıp memnun olmak isterdim ama şu an değil

    • “Açık bir modele barındırılan API üzerinden erişecekseniz, bu barındırılan API üzerinden kapalı bir model kullanmakla aynıdır” demek doğru değil
      Mesele, bunun tek bir aktör tarafından kontrol edilmemesi ve bu yüzden enshittification'a maruz bırakılamamanız. Bu zaten oldu, şimdi de oluyor, gelecekte de olacak
      Ağırlıkları açık bir modelse kolayca kovulmaz, kilitlenmez ya da erişiminiz kesilmez. Bir şirket bunu yapmaya kalksa bile sunucu çiftlikleri olan başka biri sizi müşteri olarak kabul edebilir ve iş akışınızda değişecek tek şey API URL'si ile anahtar olur
      Aynı karaktere ve aynı bilgiye sahip aynı modelle konuşmaya devam edersiniz
  • Yazının genel yönüne kısmen katılıyorum ama iki nokta var
    Birincisi, benim testlerimde açık modeller henüz yazılım geliştirme, mühendislik ve bunlara komşu işlerde en azından Claude Opus ile boy ölçüşecek seviyede değildi
    İkincisi, sürdüğü sürece tadını çıkarın. Bu yılın sonlarına doğru güvenlik bahanesiyle bu açık modellerin “yasadışı” ilan edilmemesine gerçekten şaşırırım. Burada bahane diyorum çünkü asıl itici güç düzenleyici ele geçirme ve sanayi korumacılığı olacaktır

    • ABD'de modelleri yasaklamak yalnızca Çin gibi rakip devletleri güçlendirir