3 puan yazan ragingwind 3 시간 전 | 4 yorum | WhatsApp'ta paylaş

Singapur’da ilk kez düzenlenen Quen Konferansı açılış konuşması, Alibaba Cloud’un 'agentic AI çağına' geçişi resmileştirdiği bir sahne oldu. Singapur hükümeti, Alibaba Cloud yöneticileri ve Nous Research, Fireworks AI, NVIDIA, PicsArt gibi iş ortaklarından isimler sahneye çıkarak model, altyapı, araçlar ve ekosistemin geneline yayılan değişimleri duyurdu. Temel mesaj, "token'ları zekâya, zekâyı eyleme, eylemi iş değerine" dönüştüren tam yığın bir altyapı kurmaktı.

Duyuruların öne çıkan başlıkları

  • Singapur hükümetiyle iş birliği: Devlet Bakanı Desmond Tan, Alibaba Cloud, NTUC ve ST Telemedia Data Centre ile birlikte 1.000’den fazla yerel şirket, geliştirici ve öğrenciye üretken ve agentic AI alanında uygulamalı eğitim sunacak bir iş birliği planını açıkladı. "AI, çalışanların yerini almaz; çalışanlar için çalışır" ilkesi özellikle vurgulandı.

  • Quen 3.7 Max tanıtıldı: Kodlama, araç kullanımı (MCP protokolü için yerleşik destek), çok modluluk ve uzun süreli çalışan görevler konusunda önemli ölçüde güçlendirilmiş yeni temel model tanıtıldı. Şirket, SWE-Bench, IFBench ve HLE gibi önemli benchmark’larda en üst sıralarda yer alan performans elde edildiğini söyledi.

  • Quen Cloud duyuruldu: quencloud.com adresinde ajanlara özel bir gateway kullanıma açıldı. 200’den fazla model, token tabanlı fiyatlandırma planları (aylık 30 dolar standarttan Max plana kadar) ve Skills/CLI tabanlı iş akışı otomasyonu özellikleri sunuluyor.

  • Coder ve Muron: Dizüstü bilgisayara kurulan vibe coding aracı Coder ile bulutta 24 saat çalışan çok alanlı ajan Muron tanıtıldı. Muron’un hâlihazırda 43 ülkede kullanıldığı, Alibaba içinde de yalnızca 5 kişi ve 7 günde Coder Works’ün kurum içinde geliştirildiği paylaşıldı.

  • Agentic cloud altyapısı: MicroVM tabanlı sandbox yapısı (milisaniye düzeyinde açılış, kiracı başına 10.000 eşzamanlı oturum desteği) ile ajan kimliği, yönetişim, güvenlik, bellek ve data plane katmanlarını kapsayan tam yığın altyapı tanıtıldı. MiniMax’in bu yapı üzerinde 20~40ms konteyner açılışı ve %40 TCO düşüşü elde ettiği belirtildi.

Teknik farklılaştırıcılar

  • Tam yığın entegrasyon: Şirket, silikondan (kendi PPU’su, 5. nesil CIPU) temel modellere kadar tüm katmanlara sahip olan yalnızca iki hyperscaler’dan biri olduğunu öne çıkardı.
  • Ajan yerel bulut: İnsanların kullandığı SaaS merkezli yapıdan çıkarak, ajanların doğrudan çağırıp kullandığı API’ler ve altyapı etrafında tüm control plane yeniden tasarlanıyor.
  • Açık ekosistem: PyTorch Foundation’a platin üye olarak katıldı ve Kimi, Zhipu, MiniMax, StepFun, Vidu gibi rakip model sağlayıcılarını da model stüdyosuna dahil ederek çok modelli bir hub olmayı hedeflediğini gösterdi.

Öne çıkarılan avantajlar

  • Maliyet verimliliği: Token planlarıyla maliyet görünürlüğü ve bütçe kontrolü sağlandığı, ayrıca Coder’ın otomatik model seçimiyle token maliyetlerinin %70’e kadar düşürülebileceği ifade edildi.
  • Uzun süreli çalışma yeteneği: Quen 3.7 Max’in 35 saat kesintisiz çalışmada 1.000’den fazla araç çağrısı yaptığı ve ortalama 10 kat hız artışı gösterdiği örnekler paylaşıldı.
  • Güven ve güvenlik: Gartner 2025 Access Management Magic Quadrant’ta Asya-Pasifik’ten listelenen tek satıcı olduğu belirtildi; agent firewall ve ID guard gibi çalışma zamanı güvenlik özellikleri vurgulandı.

Belirtilen sınırlamalar ve zorluklar

  • Güven inşa etmenin zorluğu: Nous Research’ten Tommy Eastman, aynı görevin tekrar üretilebilir biçimde yerine getirilmesinin hâlâ büyük bir sorun olduğunu, model kalitesi, human-in-the-loop ve ajanlar arası yönetişimden oluşan üç aşamalı bir yaklaşım gerektiğini söyledi.
  • Bellek darboğazı: Fireworks AI, çıkarım sürecindeki en büyük darboğazın hesaplama değil KV cache belleği olduğunu, çok katmanlı depolama ve sistem düzeyinde yeniden tasarım gerektiğini belirtti.
  • CPU’nun yeniden öne çıkması: NVIDIA, ajanların seri araç çağrısı yapma özelliği nedeniyle tek iş parçacığı performansı yüksek yeni CPU’lara talebin patlayacağını, mevcut bulut CPU tasarım varsayımlarının sarsıldığını vurguladı.

Ekosistem örnekleri

  • PicsArt: 130 milyon kullanıcılık tabanına Quen Image, Wan ve Happy Horse modellerini entegre ederek persona casting ve video reklam üretimi gibi ajan tabanlı iş akışlarını sergiledi. Happy Horse’un devreye alınmasından sonra video üretim hacminin %72 arttığı açıklandı.
  • Küresel hackathon: 70.000 dolar ödüllü Quen Cloud Global Hackathon ile Happy Horse Awards 2026 aynı anda duyurularak geliştirici ve üretici topluluğunun çekilmesi hedeflendi.

Google konferanslarıyla karşılaştırma

Bir ay önce düzenlenen Google Cloud Next 2025 (Nisan) ve I/O 2025 (Mayıs) da fiilen aynı yönü işaret etti, ancak kullandıkları araçlar farklıydı.

  • Google’ın duyuru dizisi: Gemini 2.5 Pro Deep Think, Agent Development Kit (ADK), Agent2Agent (A2A) protokolü, 7. nesil TPU Ironwood, Android XR gözlükleri ve Veo 3’e kadar uzanan; arama, cihaz ve altyapıyı kapsayan geniş bir duyuru akışı sundu.
  • Google’ın kullanıcı metrikleri: AI Mode’un 200 ülkede 150 milyon kullanıcıya, Gemini uygulamasının aylık 400 milyon kullanıcıya ulaştığı; token işleme hacmininse bir yılda 9,7 trilyondan 480 trilyona çıkarak 50 kat arttığı paylaşıldı.
  • Stratejik fark: Alibaba, tam yığın dikey entegrasyon ile açık kaynak (450’den fazla model, toplam 2 milyar indirme) ve rakip modelleri de içeren hub stratejisini birlikte yürütürken; Google güçlü kullanıcı erişim noktaları ile kendi TPU’su ve A2A standardında erken konumlanmasına yaslandı.
  • Her iki tarafın zayıflıkları: Google, ana Gemini modelini kapalı tutuyor ve duyurularının önemli bölümü hâlâ "coming soon" aşamasında; Alibaba ise ABD ve Avrupa pazarlarına erişim ile panelde de değinilen güvenilirlik ve bellek darboğazı sorunlarıyla karşı karşıya.
  • Kısa vadeli üstünlük alanları: Kısa vadede Google kullanıcı ölçeği ve form faktörlerinde, Alibaba ise altyapı birim maliyeti ve ABD dışı

Alibaba Cloud, yalnızca kendi model rekabetçiliğiyle ajan çağında liderliği almanın zor olduğunu görerek silikondan model, altyapı, araçlar ve ekosisteme kadar uzanan dikey entegrasyonu; PyTorch ve rakip model şirketlerini de kapsayan yatay genişlemeyle aynı anda ilerletiyor. Ancak güvenilirlik, bellek darboğazı ve CPU mimarisinin yeniden tasarımı gibi temel sorunlar panel tartışmalarında tekrar tekrar gündeme geldiği için, agentic cloud yaklaşımının gerçek kurumsal iş yüklerinde vaat ettiği performans ve ekonomiyi kanıtlaması önündeki asıl sınav henüz duruyor. Singapur’un uluslararası iş merkezi olarak konumlandırılmasıyla, ABD’li hyperscaler’larla rekabeti hızlandırma niyeti de etkinliğin tamamında açık biçimde hissedildi.

4 yorum

 
yupkidangju 1 시간 전

Yapay zeka tarafından otomatik yazılsa bile, insanların yine de doğrulama yapması gerektiğini hatırlatan öğretici bir haber.

 
jhk0530 3 시간 전

quen değil, qwen olması gerekmiyor mu? Görünüşe göre yapay zeka dikteyi pek iyi alamamış.

 
dydwls140 2 시간 전

Gözün iyiymiş, ben de qwen olarak görmüşüm lololol

 
tsboard 2 시간 전

Aynen, ben de okurken "Quen de ne?" diye kalmıştım.