GLM 5.2 yayımlandı
(twitter.com/jietang)- GLM-5.2, gerçek kullanımda mümkün olan 1M bağlam ve uzun süreli görevleri bağımsız olarak yürütmeyi destekleyen açık kaynaklı bir model olarak, karmaşık ajan uygulamaları kurmak için temel sağlıyor
- Öncü modellere erişimin teknik olmayan nedenlerle aniden engellendiği bir ortamda, bilimin küresel olması gerektiği ve AGI’ye giden yolun yüksek bariyerlerin ardına hapsedilmemesi gerektiği vurgulanıyor
- AGI, az sayıda kural koyucunun tekelinde olup her an geri alınabilecek bir ayrıcalık değil, insanlığın zekanın sınırlarını birlikte keşfedip karmaşık görevleri çözebileceği ortak bir temel olmalı
- GLM-5.2, Zhipu’nun şimdiye kadarki en güçlü açık kaynaklı modeli ve ülkenin en güçlü kodlama modelini oluşturma yolunda ana motor olmayı sürdürüyor
- Önce GLM Coding Plan’ın Lite / Pro / Max kullanıcılarına sunulacak; API’nin ise gelecek hafta açılması planlanıyor, böylece öncü zekaya erişim bir adım daha yakın hale geliyor
Temel mesaj
- Belirli bir öncü model üzerindeki ani kısıtlamalar derin bir üzüntüyle karşılanıyor; erişimin teknik olmayan nedenlerle kesildiği anlarda bilimin küresel olması gerektiği yönündeki tutum güçleniyor
- AGI’ye giden yol yüksek bariyerlerle çevrili olmamalı; AGI, insanlığın zekanın sınırlarını birlikte keşfedip karmaşık meydan okumaları çözmesi için bir köşe taşı olmalı
- AGI, az sayıda kural koyucunun tekelinde olup her an geri alınabilecek bir ayrıcalık olmamalı; dış engeller ve kısıtlamalar karşısında radikal açıklığa ihtiyaç var
- Öncü zeka açık kaynak, erişilebilirlik ve inşa edilebilirlik özelliklerini korumalı ve kendini adamış tüm geliştiricilere sunulmalı
GLM-5.2 duyurusu ve kullanım takvimi
- GLM-5.2, Zhipu’nun bugüne kadar yayımladığı en güçlü açık kaynaklı modeldir
- Bu model, gerçek kullanımda mümkün olan 1M bağlam penceresini destekler ve uzun süreli görevleri bağımsız biçimde tamamlama konusunda sürekli üstünlüğünü korur
- Karmaşık ajan uygulamaları oluşturmak için sağlam bir temel sunar ve ülkenin en güçlü kodlama modelini geliştirmek için ana motor olmayı sürdürür
- GLM-5.2, 5:21’de GLM Coding Plan kullanıcılarına resmen sunulacak ve bu kapsama Lite / Pro / Max kullanıcılarının tamamı dahildir
- API’nin gelecek hafta açılması planlanıyor ve ModelKey
GLM-5.2olarak belirtiliyor
1 yorum
Hacker News görüşleri
Z.ai kurucusunun açıklamasına göre GLM-5.2, “tamamen açık” bir model ve bazı öncü model erişimlerinin teknik olmayan nedenlerle aniden kısıtlandığı bir ortamda öncü düzey zekanın herkes için açık olması gerektiğini savunuyor
GLM-5.2, Zhipu’nun bugüne kadarki en güçlü açık kaynak modeli ve gerçekten kullanılabilir 1M bağlam penceresi ile uzun süreli görevleri bağımsız yürütebilme yeteneğini öne çıkarıyor
Önce GLM Coding Plan’ın Lite / Pro / Max kullanıcılarına sunulacak, API’nin ise gelecek hafta yayımlanacağı belirtiliyor
https://x.com/jietang/status/2065784751345287314
Qwen gibi diğer Çin menşeli açık ağırlıklı modellerden farklı görünüyor
Henüz benchmark sonuçlarını içeren resmî bir blog yazısı görünmüyor, ancak Çin yapay zeka laboratuvarlarının çalışmalarını böyle yayımlayıp izin verici bir lisansla dünyaya katkıda bulunmaları yine takdiri hak ediyor
Fable 5 olayı, bu tür açık modellerin ne kadar değerli olduğunu bir kez daha gösteriyor
Yine de oldukça etkileyici ve fazlasıyla kullanılabilir
Mimari ya da karmaşık problemler konusunda belirgin biçimde daha zayıf, ama bunun dışında farklı bir şey bekleyen de çok yoktur sanırım
Özellikle tasarım ve kullanıcı arayüzü tarafında, ağırlık sınıfının üstünde iş çıkarıyor gibi; ama bu kişisel bir tercih de olabilir
Son birkaç günde Çin laboratuvarları MiniMaxM3, KimiK2.7 ve GLM5.2’yi yayımladı; bu sırada ABD modelleri sansürlemekle meşgul
Neredeyse bir roman gibi okunuyor
Mevcut Anthropic meselesinde ABD’nin modelleri sansürlediği söylenebilir, ama bu durum daha çok Trump yönetiminin genel yolsuzluğu, intikamcılığı, haraççılığı ve beceriksizliği gibi görünüyor
Umarım beklediğim C++ kütüphanesi OpenGL Mathematics değildir
ABD hükümetinin Fable konusunda son dönemde yaptıklarına bakınca, bu gidişat giderek geleceğe daha çok benziyor
Kapıyı keyfine göre kilitleyen bir aktörün stratejik ürünlerine bağımlı olunamaz
Açık ağırlıklı modeller doğası gereği buna karşı neredeyse bağışıktır
ABD hükümeti, yabancı açık ağırlıklı modellerle işlem yapmayı, onları indirmeyi ya da kullanmayı yasa dışı hâle getirebilir
Bunu bireylere karşı uygulamak zor olurdu ama şirketler temelde buna uyardı ve iş yaptırım boyutuna gelirse GitHub gibi ABD merkezli barındırma hizmetlerinden de kaldırılabilirler
Üstelik zaten korkutucu düzeyde bir kitlesel gözetim düzenine hızla yaklaşıyoruz; bu da uygulamayı kolaylaştırabilir
Fable durumu son derece tehlikeli bir emsal yaratıyor ve bilgi ile hesaplama özgürlüğü mücadelesinde kaybediyor gibiyiz; bu yüzden gelecek konusunda endişeliyim
Bu saçmalığı körükleyen taraf Anthropic
Haber vermeden sonuç kalitesini düşürüyor ve “güvenlik” bahanesiyle istekleri reddediyor
Hükümet yabancı kullanıcılar için modeli kapatma talimatı vermemiş olsaydı bile, Anthropic kendi başına o kadar kötü ki durum yine de çok kötü olurdu
Anthropic’in hükümetten Fable yasak mektubunu aldığı Çin saatiyle 17:21 ile tam aynı anda yayımlandı ve diğer modellerin kullanılamaz hâle gelmesi durumuna açıkça değiniyor
Oldukça tuhaf görünüyor
Gönderiyi sonradan düzenlemiş olma ihtimali de yok mu?
Bu duyuru sanki Mythos dramasının etkisinden faydalanmak için aceleye getirilmiş gibi
“Fable’ı kullanamayacağınız için üzgünüz ama hafta sonu boyunca bizimkini deneyin” havası veriyor; aslında gelecek hafta için planlanmış olabilir, bu yüzden benchmark’lar henüz tam hazır görünmüyor
5.2 flash sürümünü bekliyorum
Biraz zaman geçti ama 4.7 flash hâlâ en güçlü yerel kodlama modellerinden biri gibi geliyor bana
Yerel modellerde hâlâ en iyisi Qwen-3.5
3.6’nın VRAM kullanımı 24GB’ı biraz aşıyor; o noktadan sonra artık tüketici sınıfı GPU kullanmıyor oluyorsunuz
Keşke yeni modelin yetenekleri, nelerin beklenebileceği, daha ucuz mu, daha hızlı mı, çıktı kalitesi daha mı iyi gibi şeyleri ele alan bir blog yazısı olsaydı
Yine de yayımladıkları için teşekkürler
Gerçekte ne kadar hesaplama kaynağı gerektiğini ve farklı varyantların gereksinimlerini merak ediyorum
Google’ın TurboQuant, MTP gibi optimizasyonları veya kendi yenilikleriyle öncü seviye kaliteyi yerel kullanıcılar için gerçekçi biçimde erişilebilir kılıp kılamadıklarını da bilmek isterim
Makul anlamda yerel bir model değil, ancak açık bir model olduğu için ağırlıklar yaklaşık bir hafta içinde yayımlandığında, token başı fiyatla rekabet eden birkaç üçüncü taraf çıkarım sağlayıcısı ortaya çıkacaktır
Tüketici donanımında etkili biçimde çalışan yerel model diye bir şey yok; bunu söyleyen ya yalan söylüyordur ya da hayal görüyordur