1 puan yazan GN⁺ 4 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • ABD hükümetinin Mythos ve Fable 5 erişim kısıtlamaları uzadıkça, Japonya’dan Sakana AI ve Çin’den 360 sırasıyla Fugu ve Tulongfeng/Yitianzhen ile oluşan boşluğu hedefliyor
  • Sakana AI’nin Fugu modeli, Fable 5 ve Mythos Preview ile rekabet edebilecek bir model olarak tanıtılıyor; birden fazla model API’sini koordine eden ajanlara yönelik bir model olarak tasarlandı
  • Çinli 360’ın Tulongfeng modeli yazılım açıklarını otomatik keşfetmeye, Yitianzhen ise siber savunma ve olay müdahalesini otomatikleştirmeye odaklanıyor
  • Sakana AI, çıkış zamanlamasının tesadüf olduğunu söylese de “ihracat kontrolü riski olmayan frontier capability” vurgusuyla Japon şirketleri ve kamu kurumlarını hedefliyor
  • ABD modellerinin önemi hâlâ sürüyor; ancak ihracat kısıtlamaları, Tokyo’daki ve Çinli şirketlerin yerel dil ve bağlama uyarlanmış bölgesel alternatifleri öne çekmesine yol açtı

Anthropic ihracat kısıtlamalarının yarattığı model boşluğu

  • Reuters’ın haberine göre Çinli siber güvenlik şirketi 360, çarşamba günü Tulongfeng’i tanıttı
    • 360, Tulongfeng’in Anthropic’in siber güvenliğe özel yapay zeka modeli Mythos ile rekabet edebileceğini belirtti
    • Mythos ve daha kısıtlı sürümü Fable 5, Trump Administration adımları nedeniyle şu anda ABD vatandaşı olmayan kullanıcılara sunulmuyor
  • Aynı haftanın başında Tokyo merkezli Sakana AI, Japoncada balon balığı anlamına gelen Fugu’yu piyasaya sürdü
    • Fugu, “Anthropic’in Fable 5 ve Mythos Preview gibi öncü modelleriyle aynı seviyede” olarak tanımlandı
    • Ajanlar için tasarlandı ve diğer modellerin API erişimini koordine edebiliyor
  • Her iki ürün de ABD hükümetinin Anthropic ile ilgili emrinden iki hafta sonra ortaya çıktı

Sakana AI’nin Fugu stratejisi

  • Sakana AI sözcüsü, Fugu’nun çıkışının Mythos/Fable ihracat kısıtlamalarıyla çakışmasının “entirely coincidental” olduğunu söyledi
    • Bununla birlikte şirketin web sitesi “ihracat kontrolü riski olmayan frontier capability” ifadesini öne çıkarıyor
    • Sakana AI, Fugu’yu geçen yıldan beri geliştirdiğini ve ilgili araştırmanın bu yıl ilkbaharda ICLR’de sunulduğunu açıkladı
  • Şirket, 2023’te Google çıkışlı David Ha ve Llion Jones ile Mercari ve Stability AI çıkışlı Ren Ito tarafından ortaklaşa kuruldu
    • Küçük veri kümelerinde de iyi çalışan, Japoncaya ve Japon kültürüne optimize edilmiş uygun maliyetli üretken yapay zeka modelleri geliştiriyor
  • Fugu’nun hedef müşterileri, artan ihracat kontrollerine maruz kalma riskini azaltmak isteyen Japon şirketleri ve kamu kurumları
    • Sakana AI bunu, Asya’nın ABD yapay zekasından kalıcı olarak kopması yönünde bir eğilim olarak görmüyor
    • Sözcü “U.S. models remain important to Asia” dedi
  • Ren Ito, Project Syndicate’teki yazısında ABD federal hükümetinin ilk önceliğinin yakın müttefiklerin erişimini korumak olması gerektiğini ve yapay zekanın stoklanan değil, birlikte geliştirilen bir teknoloji olması gerektiğini savundu
  • David Ha, X’te “Orchestration Models are the next frontier, beyond bigger models” diye yazdı
    • Ulusal altyapının tek bir sağlayıcıya bağlı olmasının riskli olduğunu ve son ihracat kontrollerinin bu riski göz ardı edilemez hale getirdiğini düşünüyor
    • “Access to top models can disappear overnight” diye yazarak kolektif zekayı, güç yoğunlaşmasına karşı pratik bir korunma aracı olarak nitelendirdi

360’ın güvenlik yapay zekası ve stratejik varlık mantığı

  • 360, Reuters ve Quartz haberlerine göre iki yapay zeka güvenlik aracı tanıttı
    • Tulongfeng: Yazılım açıklarını otomatik olarak bulmak üzere tasarlandı
    • Yitianzhen: Siber savunmayı ve olay müdahalesini otomatikleştirmek üzere geliştirildi
  • Reuters’ın haberine göre 360 kurucusu Zhou Hongyi, açık tespiti yapan yapay zekayı ulusal stratejik varlık olarak görüyor
    • Yalnızca bazı aktörlerin gelişmiş açık tespit kabiliyetlerine erişebildiği “one-way transparency” riskine dikkat çekti
  • 360, TechCrunch’ın yorum talebine yanıt vermedi

Anthropic’in büyümesi ve bölgesel alternatiflerin yükselişi

  • Anthropic, Mayıs 2026’da yıllıklandırılmış gelirinin 47 milyar doları aştığını açıklamıştı
    • Bunun ne kadarının Asya’daki kurumsal müşterilere dayandığı açıklanmadı
  • İhracat emrinin yürürlüğe girmesinden sonraki haftalarda Sakana AI ve 360, Anthropic modellerine erişim kısıtlamalarının yarattığı boşluğa girdi
  • ABD şirketleri yasak sona erdikten sonra güveni yeniden kazanabilecek olsa bile, yerel dili ve nüansları daha iyi anlayacak şekilde eğitilmiş bölgesel alternatifler boşluğu şimdiden dolduruyor

1 yorum

 
GN⁺ 4 시간 전
Hacker News yorumları
  • Fugu modelini C# ve Unity’de MCP, OpenCode ile gerçek işlerde denedim; tema sistemini inceleme ve renk değişikliği planlama işi tek seferde $20 planının 5 saatlik sınırını tamamen tüketti
    Uygulama sonucunu görmek için $100 planına yükselttim ama Opus’tan daha kötü ve inanılmaz yavaştı; yeni 5 saatlik sınırı da bitirdi, haftalık limitin %35’ini harcadı, buna rağmen Opus’un çok daha az zaman ve maliyetle yaptığı seviyeye bile yaklaşamadı
    Bu bilgiyi istediğiniz gibi değerlendirin ama para israfı gibi görünüyor

    • Fugu bağımsız bir model değil; arka planda OpenAI, Anthropic gibi çeşitli mevcut SaaS modellerini çağırıp yanıtları birleştirerek sonuç üreten bir yapı
      Birden fazla yapay zeka modelinin sonuçlarını birleştirdikten sonra kendi özel modeliyle nihai sonucu üretmenin, tek bir arka uç modelinden daha iyi kalite verdiğini iddia ediyorlar; ancak o kendi modellerinin gerçekten var olup olmadığından ve yeterince yetkin olup olmadığından şüpheliyim
      İddia doğru olsa bile, Claude Code gibi istemci tarafında arka plan modellerine benzer performansta bir modelle nihai sonucu ürettirerek bunun kolayca uygulanabileceği görülüyor; hizmette şüpheli bir koku var
    • Unity yerine Godot için benzer bir hizmet sunan biri olarak, Opus gibi üst seviye modeller kullanıldığında $20 planının tek bir promptta tükenmesi makul
      API ücretini aynen ödeyip 10 kat sübvansiyonu karşılayamıyorsanız böyle olur
    • Cursor’da Fable’ı test ettim; yaptığım veri web sitesini daha az “Claudevari” gösterecek fikirler sordum, 10 dakikada $40 harcayıp en işe yaramaz ve en Claudevari CSS stillendirmesini çıkardı
      Web sitesinin kendisi Opus ile yapılmıştı, yani sonuç Opus’tan daha kötüydü de denebilir
      ABD modellerinde de aynı deneyimi yaşadığıma göre, belki o Asya modelleri de Mythos türündendir
    • Hangi Unity MCP’yi kullandığını merak ediyorum
      Resmi MCP’yi deniyorum; başkalarının ne kullandığını bilmek istiyorum
      Ünlü coplay tarafında paket çakışmaları yaşadım
    • Web araması/araştırmada da benzerdi ve Opus ile karşılaştırınca kötüydü
      Yarısını kaçırdı, diğer yarısı da ya eski bilgiydi ya da doğrulanmamıştı
  • Fugu Ultra gerçekte bir model değil, birçok modele yönlendirme yapan bir sistem; bulut harness’ına daha yakın görünüyor ve OpenRouter’ın Fusion’ına benziyor
    “Tek bir dev model değil; Fugu, eğitilmiş çok ajanlı bir orkestrasyon sistemidir. Görevleri değiştirilebilir temel model havuzuna yönlendiren ve kendi örneklerini yinelemeli olarak çağıracak şekilde eğitilmiş bir dil modelidir.” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • “Mythos-like” ifadesi yavaş yavaş sinir bozucu olmaya başladı
    Sıradan kullanıcıların kıyaslamak için benchmarklara bakmaktan başka yolu yok

    • “Mythos-like” sadece söylentiyle aşırı şişirilmiş demek ve burada doğru kullanılmış bir ifade
    • Asyalı yapay zeka girişimleri de cesur iddialarda bulunuyor ama gerçekte karşılaştırma yapmanın yolu yok; Trump’ın müdahalesinin özünün de Faible’ın damıtılmasını engellemek olduğu düşünülebilir
    • Herkese açık benchmark da yok değil mi?
  • Güvenilir benchmarklar yoksa, bunların Mythos’a benzemesi yalnızca metin alıp metin çıktısı vermeleri anlamına gelir

    • Artık benchmarklara pek bakmıyorum
      Yeni bir model çıkınca onu doğrudan büyük ölçekli özel sistem yazılımı kod tabanımızda ve gerçek yayındaki ürünümüzde ya da bir gün yayımlanacak projede deniyoruz
      Hangi modelin işi daha iyi veya daha hızlı yaptırdığı oldukça net; şu anda ihtiyaç duyduğumuz kadar kullanabileceğimiz token bütçemiz olduğu için şanslıyız
      Benchmark, değerlendirme, pazarlama, sistem kartı gibi şeylere ihtiyacım yok; web’de yalnızca ipuçları, pratik çalışma yöntemleri ve çıkış haberlerini okuyorum
      Meslektaşlarımla deneyimlerimi paylaşıyorum ama bunun dışındaki her şey gürültü
    • Mythos gibi aşırı şişirildiyse, “Mythos-like” listesine bunu da ekleyebiliriz
      Muhtemelen eksik olan şey, CEO’nun dünyaya “Modelimiz internete açılmak için fazla tehlikeli; çok geç olmadan birinin bizi durdurması gerekiyor” diye uyarıda bulunduğu sahne
    • Makalede benchmarklar var: https://arxiv.org/abs/2606.21228
  • Yatırımcı listesi etkileyici: https://sakana.ai/company-info/?lang=en
    Birkaç gün önce HN başlığında da yer aldı ve 100’den fazla yorum vardı: https://news.ycombinator.com/item?id=48624782

    • Bu şirketler daha önce model çıkardı mı?
      Birdenbire Mythos seviyesinde bir model çıkardıklarına inanmak zor
      DeepSeek, Z.ai, Alibaba/Qwen bu işi çok daha uzun süredir yapıyor ve son 18 ayda performansını sürekli artıran modeller yayımladılar
      Hiç önceki çıkış olmadan yeni şirketlerin bir anda Mythos seviyesinde model ortaya koyduğuna inanmak güç
    • Geçen yıl oldukça küçük düşürücü bir geri çekme de vardı
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Bu yıl bitmeden “güvenlik endişeleri” gerekçesiyle yabancı LLM yasağı geleceğini düşünüyorum
    Gerçek performansla ilgisi olmayacak
    Ama Anthropic, Mythos türü sistemler için bir taban çizgisi oluşturdu; bu gevşek tanımlı ölçüte uyan şeyler halka tehlikeli kabul edilecek gibi

    • Pratikte bu nasıl işleyebilir?
    • Öyle olursa ABD teknolojisine elveda, Çin’e merhaba denir gibi
      Kimse beklemeyecek ve şişeden çıkmış cini tekrar şişeye sokamazsınız
    • Modeller gelişse bile gerçek bir risk yokmuş gibi konuşmak saçma
      Şu anda akıllıca şeyler söyleyen tek şeyin Claude olduğu başka bir gerçeklikte yaşıyormuşum gibi hissediyorum
      İnsanların yazdığı neredeyse her şey halüsinasyon ve gösteriş amaçlı saçmalık gibi görünüyor
  • Alaycı bakarsak, model sadece fena olmasa bile Mythos seviyesinde olduğu iddiasını çürütmek zor
    Çünkü artık Mythos kullanılamıyor

    • Mythos gibi bir şey neydi ki?
      Erişim hakkı olmayan biri olarak merak ediyorum
  • İlk izlenimim şu: “Üçüncü taraf benchmark yoksa defol git”
    Şahsen bu iki şirketin ikisini de daha önce duymadım
    Pazarın en iyi modelleriyle başa baş olduklarına öylece inanmamızı mı bekliyorlar?
    Sakana kendi modelini “Orchestration Model” diye tanımlıyor; bu, gerçekte birkaç modeli birbirine ekledikleri anlamına mı geliyor?

    • İyi bir model yapmak gerçekten bu kadar zor mu, yoksa işin özü eğitime ayrılan kaynak ölçeği mi?
      Gerçekten bilmediğim için soruyorum
      Elbette önemsiz bir iş değildir ama bilinen mevcut tekniklerin üzerine inşa etmek için dünya çapında gizli bilgi mi gerekiyor?
      Hâlâ keşfedilecek çok sayıda kolay kazanım varmış, sınırlayıcı etken de zaman ve kaynakmış gibi geliyor
    • Yakın zamanda HN’de yayımlanan duyuru yazısının yorumlarında, bunun gerçek bir modelden çok OpenRouter’a benzediği yönünde bir hava vardı
    • Benim izlenimime göre de öyle
      Yeni bir model karışımından ziyade, bir tür dinamik yöntemle anında tutkal sürülen bir yapı olduğunu iddia ediyor gibi
      O zamanki tepkiler de burada görülebilir: https://news.ycombinator.com/item?id=48624782 (6 gün önce, 244 puan, 133 yorum)
    • Anthropic üçüncü taraf benchmark verdi mi?
      O zaman da böyle mi söylüyordun?
      Önemli olduğu doğru ama tavır yanlış
  • https://arena.ai/leaderboard üzerinde benchmark yoksa bunun %100 dolandırıcılık olduğunu düşünen basit biriyim

    • ARC AGI ile karşılaştırınca nasıl?
  • Buradaki birçok yorumdaki gibi ben de Fugu’yu ve birkaç başka modeli test ettim; epey pahalı modellerdi
    20 dolarla tüm iş akışını bitirmek için yeterli olmadı, Opus’ta ise mümkündü
    Elbette Opus’ta da en iyi sonucu istiyorsanız prompt’u baştan daha fazla ince ayarlamanız gerekebilir, ama şu ana kadarki deneyimim bu
    Bir sonraki testimi ajan tipi sistem olarak yapıp performansa bakacağım