1 puan yazan GN⁺ 2 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • GLM-5.2, gerçek kullanımda mümkün olan 1M bağlam ve uzun süreli görevleri bağımsız olarak yürütmeyi destekleyen açık kaynaklı bir model olarak, karmaşık ajan uygulamaları kurmak için temel sağlıyor
  • Öncü modellere erişimin teknik olmayan nedenlerle aniden engellendiği bir ortamda, bilimin küresel olması gerektiği ve AGI’ye giden yolun yüksek bariyerlerin ardına hapsedilmemesi gerektiği vurgulanıyor
  • AGI, az sayıda kural koyucunun tekelinde olup her an geri alınabilecek bir ayrıcalık değil, insanlığın zekanın sınırlarını birlikte keşfedip karmaşık görevleri çözebileceği ortak bir temel olmalı
  • GLM-5.2, Zhipu’nun şimdiye kadarki en güçlü açık kaynaklı modeli ve ülkenin en güçlü kodlama modelini oluşturma yolunda ana motor olmayı sürdürüyor
  • Önce GLM Coding Plan’ın Lite / Pro / Max kullanıcılarına sunulacak; API’nin ise gelecek hafta açılması planlanıyor, böylece öncü zekaya erişim bir adım daha yakın hale geliyor

Temel mesaj

  • Belirli bir öncü model üzerindeki ani kısıtlamalar derin bir üzüntüyle karşılanıyor; erişimin teknik olmayan nedenlerle kesildiği anlarda bilimin küresel olması gerektiği yönündeki tutum güçleniyor
  • AGI’ye giden yol yüksek bariyerlerle çevrili olmamalı; AGI, insanlığın zekanın sınırlarını birlikte keşfedip karmaşık meydan okumaları çözmesi için bir köşe taşı olmalı
  • AGI, az sayıda kural koyucunun tekelinde olup her an geri alınabilecek bir ayrıcalık olmamalı; dış engeller ve kısıtlamalar karşısında radikal açıklığa ihtiyaç var
  • Öncü zeka açık kaynak, erişilebilirlik ve inşa edilebilirlik özelliklerini korumalı ve kendini adamış tüm geliştiricilere sunulmalı

GLM-5.2 duyurusu ve kullanım takvimi

  • GLM-5.2, Zhipu’nun bugüne kadar yayımladığı en güçlü açık kaynaklı modeldir
  • Bu model, gerçek kullanımda mümkün olan 1M bağlam penceresini destekler ve uzun süreli görevleri bağımsız biçimde tamamlama konusunda sürekli üstünlüğünü korur
  • Karmaşık ajan uygulamaları oluşturmak için sağlam bir temel sunar ve ülkenin en güçlü kodlama modelini geliştirmek için ana motor olmayı sürdürür
  • GLM-5.2, 5:21’de GLM Coding Plan kullanıcılarına resmen sunulacak ve bu kapsama Lite / Pro / Max kullanıcılarının tamamı dahildir
  • API’nin gelecek hafta açılması planlanıyor ve ModelKey GLM-5.2 olarak belirtiliyor

1 yorum

 
GN⁺ 2 시간 전
Hacker News görüşleri
  • Z.ai kurucusunun açıklamasına göre GLM-5.2, “tamamen açık” bir model ve bazı öncü model erişimlerinin teknik olmayan nedenlerle aniden kısıtlandığı bir ortamda öncü düzey zekanın herkes için açık olması gerektiğini savunuyor
    GLM-5.2, Zhipu’nun bugüne kadarki en güçlü açık kaynak modeli ve gerçekten kullanılabilir 1M bağlam penceresi ile uzun süreli görevleri bağımsız yürütebilme yeteneğini öne çıkarıyor
    Önce GLM Coding Plan’ın Lite / Pro / Max kullanıcılarına sunulacak, API’nin ise gelecek hafta yayımlanacağı belirtiliyor
    https://x.com/jietang/status/2065784751345287314

    • GLM’nin iyi tarafı, OpenRouter’da kullanırken ABD merkezli sağlayıcılar ve veri saklama yok koşullarıyla filtrelenebilmesine izin vermesi
      Qwen gibi diğer Çin menşeli açık ağırlıklı modellerden farklı görünüyor
    • “GLM-5.2 is Fully Open” ifadesinin yalnızca açık ağırlıklar anlamına mı geldiğini, yoksa kaynak ve verilerin de açıldığını mı merak ediyorum
  • Henüz benchmark sonuçlarını içeren resmî bir blog yazısı görünmüyor, ancak Çin yapay zeka laboratuvarlarının çalışmalarını böyle yayımlayıp izin verici bir lisansla dünyaya katkıda bulunmaları yine takdiri hak ediyor
    Fable 5 olayı, bu tür açık modellerin ne kadar değerli olduğunu bir kez daha gösteriyor

    • İlk izlenimim, öncü laboratuvarların yaklaşık 6 ay gerisinde olduğu ve ocaktaki Opus’a benzer bir his verdiği yönünde
      Yine de oldukça etkileyici ve fazlasıyla kullanılabilir
      Mimari ya da karmaşık problemler konusunda belirgin biçimde daha zayıf, ama bunun dışında farklı bir şey bekleyen de çok yoktur sanırım
      Özellikle tasarım ve kullanıcı arayüzü tarafında, ağırlık sınıfının üstünde iş çıkarıyor gibi; ama bu kişisel bir tercih de olabilir
    • Benchmark olmadan model yayımlamak, modelin muhtemelen çok iyi olmadığına dair bir işaret gibi görünüyor
  • Son birkaç günde Çin laboratuvarları MiniMaxM3, KimiK2.7 ve GLM5.2’yi yayımladı; bu sırada ABD modelleri sansürlemekle meşgul
    Neredeyse bir roman gibi okunuyor

    • kimi2.7’nin GLM5.2 ile kıyaslandığında nasıl olduğunu merak ediyorum
    • Çin modelleri de sansürlü
      Mevcut Anthropic meselesinde ABD’nin modelleri sansürlediği söylenebilir, ama bu durum daha çok Trump yönetiminin genel yolsuzluğu, intikamcılığı, haraççılığı ve beceriksizliği gibi görünüyor
  • Umarım beklediğim C++ kütüphanesi OpenGL Mathematics değildir

  • ABD hükümetinin Fable konusunda son dönemde yaptıklarına bakınca, bu gidişat giderek geleceğe daha çok benziyor
    Kapıyı keyfine göre kilitleyen bir aktörün stratejik ürünlerine bağımlı olunamaz
    Açık ağırlıklı modeller doğası gereği buna karşı neredeyse bağışıktır

    • Bu yalnızca kısmen doğru
      ABD hükümeti, yabancı açık ağırlıklı modellerle işlem yapmayı, onları indirmeyi ya da kullanmayı yasa dışı hâle getirebilir
      Bunu bireylere karşı uygulamak zor olurdu ama şirketler temelde buna uyardı ve iş yaptırım boyutuna gelirse GitHub gibi ABD merkezli barındırma hizmetlerinden de kaldırılabilirler
      Üstelik zaten korkutucu düzeyde bir kitlesel gözetim düzenine hızla yaklaşıyoruz; bu da uygulamayı kolaylaştırabilir
      Fable durumu son derece tehlikeli bir emsal yaratıyor ve bilgi ile hesaplama özgürlüğü mücadelesinde kaybediyor gibiyiz; bu yüzden gelecek konusunda endişeliyim
    • Çin de eşit seviyeye geldiğinde ya da öne geçtiğinde kapalıya dönme ihtimali çok yüksek
    • Hükümeti eleştirmek muhtemelen haklı, ama Anthropic de bedavaya kurtulmamalı
      Bu saçmalığı körükleyen taraf Anthropic
      Haber vermeden sonuç kalitesini düşürüyor ve “güvenlik” bahanesiyle istekleri reddediyor
      Hükümet yabancı kullanıcılar için modeli kapatma talimatı vermemiş olsaydı bile, Anthropic kendi başına o kadar kötü ki durum yine de çok kötü olurdu
  • Anthropic’in hükümetten Fable yasak mektubunu aldığı Çin saatiyle 17:21 ile tam aynı anda yayımlandı ve diğer modellerin kullanılamaz hâle gelmesi durumuna açıkça değiniyor

    • Gerçekten öyle mi? Saat diliminden emin değilim
      Oldukça tuhaf görünüyor
      Gönderiyi sonradan düzenlemiş olma ihtimali de yok mu?
  • Bu duyuru sanki Mythos dramasının etkisinden faydalanmak için aceleye getirilmiş gibi
    “Fable’ı kullanamayacağınız için üzgünüz ama hafta sonu boyunca bizimkini deneyin” havası veriyor; aslında gelecek hafta için planlanmış olabilir, bu yüzden benchmark’lar henüz tam hazır görünmüyor

  • 5.2 flash sürümünü bekliyorum
    Biraz zaman geçti ama 4.7 flash hâlâ en güçlü yerel kodlama modellerinden biri gibi geliyor bana

    • flash olmayacağına dair bir şey gördüğümü sanıyorum
    • Gerçekten mi? 4.7-flash benim için epey berbattı
      Yerel modellerde hâlâ en iyisi Qwen-3.5
      3.6’nın VRAM kullanımı 24GB’ı biraz aşıyor; o noktadan sonra artık tüketici sınıfı GPU kullanmıyor oluyorsunuz
  • Keşke yeni modelin yetenekleri, nelerin beklenebileceği, daha ucuz mu, daha hızlı mı, çıktı kalitesi daha mı iyi gibi şeyleri ele alan bir blog yazısı olsaydı
    Yine de yayımladıkları için teşekkürler

    • Pazartesiye kadar beklemek daha iyi olabilir
  • Gerçekte ne kadar hesaplama kaynağı gerektiğini ve farklı varyantların gereksinimlerini merak ediyorum
    Google’ın TurboQuant, MTP gibi optimizasyonları veya kendi yenilikleriyle öncü seviye kaliteyi yerel kullanıcılar için gerçekçi biçimde erişilebilir kılıp kılamadıklarını da bilmek isterim

    • GLM-5 serisi 744B-A40B
      Makul anlamda yerel bir model değil, ancak açık bir model olduğu için ağırlıklar yaklaşık bir hafta içinde yayımlandığında, token başı fiyatla rekabet eden birkaç üçüncü taraf çıkarım sağlayıcısı ortaya çıkacaktır
    • Donanıma 80 bin dolar harcarsanız çalıştırabilirsiniz
      Tüketici donanımında etkili biçimde çalışan yerel model diye bir şey yok; bunu söyleyen ya yalan söylüyordur ya da hayal görüyordur