1 puan yazan GN⁺ 5 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • Mistral, yalnızca bir model şirketi olmanın ötesine geçerek compute, model, platform ve danışmanlığı bir araya getiren uçtan uca bir yapay zeka yığını şirketi olma yönünde ilerliyor
  • Paris’teki 40MW veri merkezi ve ek veri merkezi planlarıyla, müşterinin sahip olabildiği ve şirket içinde çalıştırılabilen açık, özelleştirilebilir modellerle farklılaşıyor
  • Yeni model duyurularından çok iş ortaklıkları öne çıktı; ASML, BNP Paribas, Amazon Alexa+ iş birlikleri ve Vibe for Work’ün tanıtımı öne çıkan başlıklardı
  • Ajan sistemlerinde harness, bağlam, kalıcılık ve öğrenme eklerken; muhakeme, hata toparlama ve şeffaflığın korunmasında temel unsur olarak ele alınıyor
  • Küçük ve uzmanlaşmış modeller ile şirket içi dağıtım, regülasyona tabi sektörler ve Avrupalı şirketler için konumlanan bir strateji; odak AGI yarışından çok somut yatırım getirisi

Mistral’ın konumlanması

  • Mistral, bir model şirketi olarak kalmak yerine compute, model, platform ve danışmanlığı kapsayan uçtan uca bir yapay zeka yığını kurma yönünde ilerliyor
  • Paris’te 40MW veri merkezi bulunuyor ve İsveç dahil ek veri merkezleri de planlanıyor
  • Anthropic veya OpenAI’den ayrıştığı nokta, verimli, açık ve özelleştirilebilir modellerin müşteri tarafından sahiplenilebilmesi ve şirket içinde çalıştırılabilmesi
  • Etkinliğin mesajı, yeni modeller veya teknik atılımlardan çok iş ortaklıklarına ağırlık verdi
    • ASML, BNP Paribas, Amazon Alexa+ iş birlikleri, gerçek sorunların yapay zeka ile çözülmesine örnek olarak ele alındı
    • Vibe for Work tanıtıldı; Claude for Work’e benzer bir ürün olarak sunuldu

Ürün stratejisi ve kullanım örnekleri

  • Ajan sistemleri ve harness

    • Yalnızca model yeterli değil; harness, bağlam, kalıcılık ve öğrenme ekleme görevini üstleniyor
    • Muhakeme (reasoning), sistemin geri dönmesini, hatalardan toparlanmasını ve şeffaflığını korumasını sağlayan temel unsur olarak ele alınıyor
    • Kurumsal en iyi uygulamalar beceriler (skills) olarak yakalanıyor ve yapay zeka ajanlarıyla birlikte çalışma sürecinde gelişiyor
  • Küçük ve uzmanlaşmış modeller

    • Mistral, küçük, hızlı ve odağı net modellerin enerji verimliliği ve hızda büyük genel amaçlı modelleri geride bıraktığı örnekler sunuyor
    • Document AI, OCR için bir model ve EU Patent Office bunu büyük ölçekli OCR için kullanıyor
    • Voxtral, çok dilli bir ses modeli ve Avrupa’da Amazon Alexa+’ı çalıştırmak için kullanılıyor
    • Robostral, ASML ile endüstriyel robotik alanında kullanılıyor
    • Token kullanımı yüksek ajan tabanlı uygulamalarda yalnızca ham performans değil, hız ve verimlilik de önemli hale geliyor
  • Egemenlik ve şirket içi dağıtım

    • BNP Paribas, Belçika’da KYC amacıyla Mistral modellerini şirket içinde çalıştırıyor ve hassas verileri banka içinde tutuyor
    • Abanca, uygulama içinde 1 milyondan fazla müşterinin hassas bilgilerini büyük ölçekte işlemek için ajan orkestrasyonu kullanıyor
    • Regülasyona tabi sektörlerdeki Avrupalı şirketler için bu, ABD’li hyperscaler’lara bağımlılığı azaltan bir alternatif olabilir
  • Beşeri bilimlerde kullanım

    • Austrian Academy of Sciences araştırma ekibi, Mistral’ın kodlama LLM’i Codestral’ı fine-tune ederek binlerce yıllık papirüs parçalarını okuyabilir hale getirdi
    • Bu çalışma, Mısır çölünde bulunan 180 bin belge koleksiyonunu erişilebilir kılmaya katkı sağlıyor
    • Yapay zeka olmasaydı 2.000 yıldan fazla sürecek bir iş olarak sunuluyor
    • Austrian Academy of Sciences’in Apollo projesi, yapay zekanın beşeri bilimlere de katkı sağlayabileceğini gösteren bir örnek
  • Avrupa yapay zeka iş ortağı stratejisi

    • Mistral’ın vizyonu, AGI yarışını kazanmaktan çok bugün somut yatırım getirisi sunan bir Avrupa tam yığın yapay zeka iş ortağı olmaya daha yakın
    • Bu stratejinin başarısı, daha fazla Avrupalı şirketin Mistral’ın yaklaşımını benimseyip benimsemeyeceğine bağlı
    • Açık modeller, şirket içi dağıtım ve kurumsal iş ortaklıklarının birleşimi, AB’deki birçok büyük kuruluş için cazip olabilir
    • ABD’li teknoloji devlerine körü körüne bağımlı olunan dönem sona eriyor; önemli olan, artık ciddi bir Avrupalı yapay zeka oyuncusunun ortaya çıkmış olması

1 yorum

 
GN⁺ 5 시간 전
Hacker News görüşleri
  • Mistral ve göreve özel küçük modelleri gerçekten destekliyorum ama Mistral, 2025’in 3. çeyreğinden beri fazlasıyla geride kaldı
    Artık rekabet edebilmek için orta düzey bağlam uzunluklarında bile iyi çıkarım modelleri çalıştırabilmek gerekiyor, ama Mistral bunu yapamıyor gibi görünüyor
    Şu anda küçük model tarafında Gemma4 ve Qwen3.6 en iyileri ve Mistral’ın “small” modeli 120B ile yaklaşık 4 kat daha fazla parametreye sahip olmasına rağmen dörtte biri büyüklüğündeki modellerle bile düzgün şekilde rekabet edemiyor
    Bir yıl önce Mistral Small 3.1 döneminde tempoyu koruyordu ama şimdi neredeyse tamamen görünmez hale gelmiş durumda
    Mistral, şirket içi kurulumlar ve göreve özel küçük model pazarını gerçekten hedefliyorsa, r/localLlama tarafındaki insanların heyecanlanacağı modeller üretmek oldukça iyi bir vekil gösterge olabilir

    • Katılıyorum. Le Chat Pro için ödeme yapan bir kullanıcıyım ve Avrupa alternatifi fikrini gerçekten destekliyorum ama Mistral ile frontier laboratuvarları arasındaki kalite farkı artık görmezden gelinemeyecek kadar büyüyor
      Konferansta yeni modellerden pek söz edilmemesi de endişe verici. Bana göre asıl odaklanmaları gereken konu tam da bu
      Önlerini neyin kestiğini merak ediyorum. Para mı, hesaplama kaynağı mı, yetkinlik mi, eğitim verisi mi, bilmiyorum
      Gerçekten iyi modeller yapmak için frontier model çıktıları gibi epey şüpheli verilerle eğitim yapmak gerekiyor ama Mistral fazla Avrupai ve kurumsal müşteri odaklı olduğu için bu riski alamıyor olabilir diye korkuyorum
    • Mistral, ABD şirketlerine satılamayan Avrupa teknoloji şirketlerinin girdiği AB vergi mükellefi parasını mümkün olduğunca çekip çıkarma aşamasına geçmiş gibi görünüyor
      Sonunda Dailymotion gibi zombi bir şirkete dönüşecek gibi
    • Bu, göreve özel küçük modeller konusundan biraz farklı ama çok bilmiyorum, o yüzden soruyorum: frontier model sağlayıcılarının daha küçük ve daha odaklı modeller çıkarmamasının temel bir nedeni var mı?
      Mesela Claude Code’da varsayılan olarak kullanılan, Opus’un yazılıma özel bir alt kümesi gibi bir modeli düşünüyorum
      Daha küçük olur, dağıtımı ve kullanımı daha ucuz olur, belki daha da hızlı olabilir
    • Katılıyorum. Frontier laboratuvarları bir sonraki fiyat artışını yaptığında ve abonelik katmanlarındaki limitleri de kaçınılmaz olarak düşürdüğünde, insanlar model sağlayıcılarını çok daha ciddi biçimde yeniden değerlendirecek
      O noktada Mistral’ın hazır olması gerekir ama son dönemdeki performansa bakınca gerçekçi olarak beklentim yüksek değil
    • Yerelde LLM çalıştırıyorum ve bana göre 22B~32B denemeye değer en üst sınır
      Mistral 4’te token başına etkin parametre sayısı 6B olduğundan, bir 4090 üzerinde token başına 3~3.5 parametre sığdırılabilse bile yaklaşık 240GB indirme ve depolama gereksinimi yerelde denemek için sınırda kalıyor
      Birden fazla modeli indirip değerlendirme durumunda bu daha da geçerli ve diğer insanların, eski Mistral/Magistral modellerinde olduğu gibi, sonradan fine-tuning üretmesini de zorlaştırıyor
  • Harika bir kamu BT yöneticisinin konuşmasını dinledim; modelleri değerlendiriyordu ve mevcut durumdan oldukça memnuniyetsizdi
    Mistral kullanmak istiyor ve bazı durumlarda kullanılabilecek tek AB tabanlı model de bu, ama performansının gerçekten kötü olduğunu ve giderek daha fazla geride kaldığını da biliyor
    Mistral, kötü olsa bile AB kullanım senaryolarında tek uygulanabilir model olma gerekçesiyle kârlı bir iş kurabilir belki. Üzücü bir durum ve izlemek can sıkıcı

  • Avrupa’nın yapay zeka geliştirme ve araştırmasına katılmasını gerçekten istiyorum ve Mistral’ı da güçlü biçimde destekledim
    Ama teknik fark çok fazla açılıyor. Bu düzeltilemezse, Avrupa’nın iyi sonuçlarla büyük teknoloji şirketleri işletemediğine dair bir kanıt daha olacak
    Esasen Çin’deki laboratuvarların neredeyse hepsi çok daha iyi iş çıkarıyor. DeepSeek’ten söz etmesek bile MiMo 2.5 ve Minimax 2.7 gibi şeyleri yapan Mistral değildi
    Mistral tarafındaki modeller ya daha zayıf, ya daha büyük ve yavaş, ya da mixture-of-experts (MoE) içermeyen modeller; bu da iyi değil

    • https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
      Avrupa, kitlesel histerinin zirvede olduğu dönemde alelacele hazırlanmış bu yasayla kendi ayağına sıktı ve artık aklı başında hiçbir şirket orada bir şey inşa etmeye çalışmayacaktır
      ABD ya da Çin’de bir yapay zeka girişimi bir çocuk ve bir bilgisayarla başlayabilir ama Avrupa’da o çocuğun yanında on iki avukat gerekir
      Mistral’ın önden başlamasına, çok umut veren ilk modellerine ve aldığı yatırıma rağmen görünmez hale gelmesi, tüm bu düzenlemelere uymaya çalışmasının sonucu olabilir
    • Teknik farkın fazla açılması derken ne kastedildiğini anlamıyorum. Öncülük etmektense yakalamak daha kolay ve daha ucuz değil mi?
    • Mixture-of-experts (MoE) konusunda, MoE’nin pratik işe yararlılığını ilk gösteren model olarak Mixtral aklımda kalmış
      Teknik raporundan çok etkilenmiştim. Tabii MoE fikrinin kendisi zaten daha önceden vardı diye biliyorum
      Mixtral model ailesini daha fazla zorlasalardı, bugünkü Qwen serisine benzer bir itibar kazanmış olabilirlerdi. Kaçırılmış bir fırsat
    • Birleşik Krallık hükümeti yakın zamanda yapay zeka araştırmalarına 10 milyon sterlin ayırdığını açıkladı ama muhtemelen bunun çoğunu danışmanlar alacak
      Bununla kıyaslayınca Avrupa bence oldukça iyi durumda
  • BNP Paribas, Belçika'da KYC için Mistral modellerini on-premise çalıştırıyor ve hassas verilerin bankanın içinde kalması önemli
    Abanca da uygulamadaki 2 milyon müşterinin hassas verileri gibi büyük ölçekli müşteri bilgilerini işlemek için ajan orkestrasyonu kullanıyor
    Düzenlemeye tabi sektörlerdeki Avrupalı şirketler için bu, ABD'li hyperscaler'lara bağımlı olmaktan daha iyi bir alternatif ve Mistral'ın on-premise ile Avrupa barındırmalı modellere odaklanması çok akıllıca bir yön

    • Kibarca söylemek gerekirse buna “çok” akıllıca demezdim. Seçeneklerin sınırlı olduğu bir durumda iyi bir seçenek sadece
      Herkes full-deployment engineering ya da müşteriye özel engineering yapıyor; aksi halde sadece token maliyetinin üstüne marj koyan bir şirket gibi görünüyorlar
      O zaman parayı Neo-SaaS şirketleri alır. Mistral'ın yapay zekasını başka kim satın alırdı ve başka hangi seçenek vardı ki
    • Mistral'ın Koyeb satın alımı ile büyük ölçekli deployment uzmanlığını güçlendirmesi de tam yerinde bir hamleydi
    • Mistral'ın kod, görsel, video gibi içerik üretimine odaklandığını sanmıyorum
      Bunun yerine çok dilli modeller, OCR, ses gibi başka alanlara odaklanıyor gibi görünüyor
      Model tanıtım sayfası da bunu gösteriyor ama o kadar renkli ve kategoriyle model adı o kadar fazla ki insanın kafası hep karışıyor
      Umarım verdikleri karar iyi sonuç verir
    • B2C'yi ya da dünya ölçeğinde SaaS pazarını bıraktıktan sonra AB girişimlerinin sık gittiği yol bu değil mi? Büyük Avrupa şirketlerine B2B ve devlet sözleşmelerine yeniden odaklanmak
      Avrupa girişimleri için kurumsal B2B bana hep ölmeye gidilen yer gibi gelmiştir
    • Yine de Mistral'ı on-premise kullanmak için sebep ne? Qwen yerine yani
  • Etkinliğe katıldım; katılımcı ölçeği etkileyiciydi ve büyük Avrupa halka açık şirketlerinin liderleri oradaydı
    Davet edilen partner sayısının çokluğu da ilginçti. Microsoft, Accenture, EY'den alpic.ai ve lingo.dev gibi girişimlere kadar uzanıyordu
    M&A tarafındaki hareketlerini de artırıyor gibiler

  • İşten bağımsız olarak web sitesi tasarımı gerçekten harika: https://mistral.ai/

    • Fazla karmaşık görünüyor ve paragraf yerleşimi de kaymış
    • Neyi özellikle iyi bulduğunu anlamadım. Telefonda kaydırdım; oldukça sıradan bir kurumsal web sitesi gibi görünüyor
    • Mistral'ın markalamasını tamamen beğeniyorum
  • Mistral'dan bir e-posta geldi; devstral gibi bazı, belki de çoğu özel modeli ağustosa kadar kademeli olarak sonlandıracaklarını ve artık genel amaçlı modelleri kullanmamızı söylüyorlar
    Maliyetler üstel şekilde artıyor
    Devstral 2'den (devstral-2512 ve devstral-latest) daha güçlü model olan Mistral Medium 3.5'e (mistral-medium-3-5, reasoning_effort değeri "high" olacak şekilde) geçmemizi önerdiklerini yazmışlar; fiyat ise giriş/çıkışta milyon token başına $1.5/$7.5
    Önceki $0.4/$2 fiyatından değişmiş

    • Aynı e-postayı aldım ama her şeyi zaten Mistral-Medium-3.5'e taşıdığımı sanıyordum; bu yüzden hâlâ hangi sonlandırılacak modeli kullandığımdan pek emin değilim
      Her hâlükârda e-postayı alınca, bunun önümüzdeki birkaç ay içinde yeni ve geliştirilmiş modeller de çıkaracaklarına dair bir işaret olmasını umdum
  • Hiç hendek yokmuş gibi görünüyor. Veri merkezi olan bir yazılım danışmanlık şirketi gibi
    Üstelik yazıda birçok müşterinin bu modelleri on-premise kullandığı söyleniyor; yani veri merkezi de pek bir avantaj sayılmaz
    Devlet destekli herhangi bir girişimin küçük açık kaynak modelleri fine-tune etmesini engelleyen şey ne

    • Belki de, doğrudan kontrol ettiğiniz daha büyük modellerden küçük modellere distillation yaparsanız, kontrol etmediğiniz daha büyük modellere dayanarak fine-tune etmekten daha iyi küçük modeller çıkarabileceğiniz içindir
      Bunun doğru olduğunu iddia etmiyorum; sadece böyle bir varsayım kurulabilir diyorum
  • Bir Avrupalı olarak buna 100 kat katılıyorum
    Bu oyuncular arasında Mistral'ın yönünü ve şeffaflığını gerçekten seviyorum

    • Avrupalı olmasanız bile, ABD ve Çin modellerine karşı bir Avrupalı rakip görmek iyi bir şey
  • Abanca'nın uygulamadaki 2 milyon müşterinin “muazzam ölçekteki” hassas müşteri verilerini işlemek için ajan orkestrasyonu kullandığını söylüyorlar ama benim muazzam ölçek ölçümüm mü bozuk bilmiyorum
    2 milyon kullanıcı demek birkaç yüz MB veri falan değil mi? Kullanıcı başına çok veri olsa bile birkaç GB eder gibi geliyor

    • Olabilir ama en yeni büyük dil modelleriyle müşteri destek taleplerini ajan yaklaşımıyla çözerseniz token tüketimi hızla artar
      Sunumdan anladığım kadarıyla, sınırlı sorumlulukları olan ajanlar ve muhtemelen daha küçük modeller kullanarak yanıtları hızlı, güvenilir ve maliyeti çok yüksek olmayacak şekilde kurmuşlar
    • Avrupa'daki tüketici odaklı şirketler, ABD şirketleri kadar kolay ölçeklenemiyor; bu da Avrupa'nın genel olarak teknoloji şirketlerini büyütürken yaşadığı sorunun büyük bir nedeni
      Buna karşılık bu tür işler epey savunulabilir olabilir ama genelde aynı ölçüde yüksek kârlılığa dönüşmez