Mistral AI Now Summit notları

(koenvangilst.nl)

2 puan yazan GN⁺ 2026-05-30 | 1 yorum | WhatsApp'ta paylaş

Mistral, yalnızca bir model şirketi olmanın ötesine geçerek compute, model, platform ve danışmanlığı bir araya getiren uçtan uca bir yapay zeka yığını şirketi olma yönünde ilerliyor
Paris’teki 40MW veri merkezi ve ek veri merkezi planlarıyla, müşterinin sahip olabildiği ve şirket içinde çalıştırılabilen açık, özelleştirilebilir modellerle farklılaşıyor
Yeni model duyurularından çok iş ortaklıkları öne çıktı; ASML, BNP Paribas, Amazon Alexa+ iş birlikleri ve Vibe for Work’ün tanıtımı öne çıkan başlıklardı
Ajan sistemlerinde harness, bağlam, kalıcılık ve öğrenme eklerken; muhakeme, hata toparlama ve şeffaflığın korunmasında temel unsur olarak ele alınıyor
Küçük ve uzmanlaşmış modeller ile şirket içi dağıtım, regülasyona tabi sektörler ve Avrupalı şirketler için konumlanan bir strateji; odak AGI yarışından çok somut yatırım getirisi

Mistral’ın konumlanması

Mistral, bir model şirketi olarak kalmak yerine compute, model, platform ve danışmanlığı kapsayan uçtan uca bir yapay zeka yığını kurma yönünde ilerliyor
Paris’te 40MW veri merkezi bulunuyor ve İsveç dahil ek veri merkezleri de planlanıyor
Anthropic veya OpenAI’den ayrıştığı nokta, verimli, açık ve özelleştirilebilir modellerin müşteri tarafından sahiplenilebilmesi ve şirket içinde çalıştırılabilmesi
Etkinliğin mesajı, yeni modeller veya teknik atılımlardan çok iş ortaklıklarına ağırlık verdi
- ASML, BNP Paribas, Amazon Alexa+ iş birlikleri, gerçek sorunların yapay zeka ile çözülmesine örnek olarak ele alındı
- Vibe for Work tanıtıldı; Claude for Work’e benzer bir ürün olarak sunuldu

Ürün stratejisi ve kullanım örnekleri

Ajan sistemleri ve harness
- Yalnızca model yeterli değil; harness, bağlam, kalıcılık ve öğrenme ekleme görevini üstleniyor
- Muhakeme (reasoning), sistemin geri dönmesini, hatalardan toparlanmasını ve şeffaflığını korumasını sağlayan temel unsur olarak ele alınıyor
- Kurumsal en iyi uygulamalar beceriler (skills) olarak yakalanıyor ve yapay zeka ajanlarıyla birlikte çalışma sürecinde gelişiyor
Küçük ve uzmanlaşmış modeller
- Mistral, küçük, hızlı ve odağı net modellerin enerji verimliliği ve hızda büyük genel amaçlı modelleri geride bıraktığı örnekler sunuyor
- Document AI, OCR için bir model ve EU Patent Office bunu büyük ölçekli OCR için kullanıyor
- Voxtral, çok dilli bir ses modeli ve Avrupa’da Amazon Alexa+’ı çalıştırmak için kullanılıyor
- Robostral, ASML ile endüstriyel robotik alanında kullanılıyor
- Token kullanımı yüksek ajan tabanlı uygulamalarda yalnızca ham performans değil, hız ve verimlilik de önemli hale geliyor
Egemenlik ve şirket içi dağıtım
- BNP Paribas, Belçika’da KYC amacıyla Mistral modellerini şirket içinde çalıştırıyor ve hassas verileri banka içinde tutuyor
- Abanca, uygulama içinde 1 milyondan fazla müşterinin hassas bilgilerini büyük ölçekte işlemek için ajan orkestrasyonu kullanıyor
- Regülasyona tabi sektörlerdeki Avrupalı şirketler için bu, ABD’li hyperscaler’lara bağımlılığı azaltan bir alternatif olabilir
Beşeri bilimlerde kullanım
- Austrian Academy of Sciences araştırma ekibi, Mistral’ın kodlama LLM’i Codestral’ı fine-tune ederek binlerce yıllık papirüs parçalarını okuyabilir hale getirdi
- Bu çalışma, Mısır çölünde bulunan 180 bin belge koleksiyonunu erişilebilir kılmaya katkı sağlıyor
- Yapay zeka olmasaydı 2.000 yıldan fazla sürecek bir iş olarak sunuluyor
- Austrian Academy of Sciences’in Apollo projesi, yapay zekanın beşeri bilimlere de katkı sağlayabileceğini gösteren bir örnek
Avrupa yapay zeka iş ortağı stratejisi
- Mistral’ın vizyonu, AGI yarışını kazanmaktan çok bugün somut yatırım getirisi sunan bir Avrupa tam yığın yapay zeka iş ortağı olmaya daha yakın
- Bu stratejinin başarısı, daha fazla Avrupalı şirketin Mistral’ın yaklaşımını benimseyip benimsemeyeceğine bağlı
- Açık modeller, şirket içi dağıtım ve kurumsal iş ortaklıklarının birleşimi, AB’deki birçok büyük kuruluş için cazip olabilir
- ABD’li teknoloji devlerine körü körüne bağımlı olunan dönem sona eriyor; önemli olan, artık ciddi bir Avrupalı yapay zeka oyuncusunun ortaya çıkmış olması

1 yorum

GN⁺ 2026-05-30

Hacker News görüşleri

Mistral ve göreve özel küçük modelleri gerçekten destekliyorum ama Mistral, 2025’in 3. çeyreğinden beri fazlasıyla geride kaldı
Artık rekabet edebilmek için orta düzey bağlam uzunluklarında bile iyi çıkarım modelleri çalıştırabilmek gerekiyor, ama Mistral bunu yapamıyor gibi görünüyor
Şu anda küçük model tarafında Gemma4 ve Qwen3.6 en iyileri ve Mistral’ın “small” modeli 120B ile yaklaşık 4 kat daha fazla parametreye sahip olmasına rağmen dörtte biri büyüklüğündeki modellerle bile düzgün şekilde rekabet edemiyor
Bir yıl önce Mistral Small 3.1 döneminde tempoyu koruyordu ama şimdi neredeyse tamamen görünmez hale gelmiş durumda
Mistral, şirket içi kurulumlar ve göreve özel küçük model pazarını gerçekten hedefliyorsa, r/localLlama tarafındaki insanların heyecanlanacağı modeller üretmek oldukça iyi bir vekil gösterge olabilir
- Katılıyorum. Le Chat Pro için ödeme yapan bir kullanıcıyım ve Avrupa alternatifi fikrini gerçekten destekliyorum ama Mistral ile frontier laboratuvarları arasındaki kalite farkı artık görmezden gelinemeyecek kadar büyüyor
  Konferansta yeni modellerden pek söz edilmemesi de endişe verici. Bana göre asıl odaklanmaları gereken konu tam da bu
  Önlerini neyin kestiğini merak ediyorum. Para mı, hesaplama kaynağı mı, yetkinlik mi, eğitim verisi mi, bilmiyorum
  Gerçekten iyi modeller yapmak için frontier model çıktıları gibi epey şüpheli verilerle eğitim yapmak gerekiyor ama Mistral fazla Avrupai ve kurumsal müşteri odaklı olduğu için bu riski alamıyor olabilir diye korkuyorum
- Mistral, ABD şirketlerine satılamayan Avrupa teknoloji şirketlerinin girdiği AB vergi mükellefi parasını mümkün olduğunca çekip çıkarma aşamasına geçmiş gibi görünüyor
  Sonunda Dailymotion gibi zombi bir şirkete dönüşecek gibi
- Bu, göreve özel küçük modeller konusundan biraz farklı ama çok bilmiyorum, o yüzden soruyorum: frontier model sağlayıcılarının daha küçük ve daha odaklı modeller çıkarmamasının temel bir nedeni var mı?
  Mesela Claude Code’da varsayılan olarak kullanılan, Opus’un yazılıma özel bir alt kümesi gibi bir modeli düşünüyorum
  Daha küçük olur, dağıtımı ve kullanımı daha ucuz olur, belki daha da hızlı olabilir
- Katılıyorum. Frontier laboratuvarları bir sonraki fiyat artışını yaptığında ve abonelik katmanlarındaki limitleri de kaçınılmaz olarak düşürdüğünde, insanlar model sağlayıcılarını çok daha ciddi biçimde yeniden değerlendirecek
  O noktada Mistral’ın hazır olması gerekir ama son dönemdeki performansa bakınca gerçekçi olarak beklentim yüksek değil
- Yerelde LLM çalıştırıyorum ve bana göre 22B~32B denemeye değer en üst sınır
  Mistral 4’te token başına etkin parametre sayısı 6B olduğundan, bir 4090 üzerinde token başına 3~3.5 parametre sığdırılabilse bile yaklaşık 240GB indirme ve depolama gereksinimi yerelde denemek için sınırda kalıyor
  Birden fazla modeli indirip değerlendirme durumunda bu daha da geçerli ve diğer insanların, eski Mistral/Magistral modellerinde olduğu gibi, sonradan fine-tuning üretmesini de zorlaştırıyor
Harika bir kamu BT yöneticisinin konuşmasını dinledim; modelleri değerlendiriyordu ve mevcut durumdan oldukça memnuniyetsizdi
Mistral kullanmak istiyor ve bazı durumlarda kullanılabilecek tek AB tabanlı model de bu, ama performansının gerçekten kötü olduğunu ve giderek daha fazla geride kaldığını da biliyor
Mistral, kötü olsa bile AB kullanım senaryolarında tek uygulanabilir model olma gerekçesiyle kârlı bir iş kurabilir belki. Üzücü bir durum ve izlemek can sıkıcı
Avrupa’nın yapay zeka geliştirme ve araştırmasına katılmasını gerçekten istiyorum ve Mistral’ı da güçlü biçimde destekledim
Ama teknik fark çok fazla açılıyor. Bu düzeltilemezse, Avrupa’nın iyi sonuçlarla büyük teknoloji şirketleri işletemediğine dair bir kanıt daha olacak
Esasen Çin’deki laboratuvarların neredeyse hepsi çok daha iyi iş çıkarıyor. DeepSeek’ten söz etmesek bile MiMo 2.5 ve Minimax 2.7 gibi şeyleri yapan Mistral değildi
Mistral tarafındaki modeller ya daha zayıf, ya daha büyük ve yavaş, ya da mixture-of-experts (MoE) içermeyen modeller; bu da iyi değil
- https://en.wikipedia.org/wiki/Artificial_Intelligence_Act#Pe...
  Avrupa, kitlesel histerinin zirvede olduğu dönemde alelacele hazırlanmış bu yasayla kendi ayağına sıktı ve artık aklı başında hiçbir şirket orada bir şey inşa etmeye çalışmayacaktır
  ABD ya da Çin’de bir yapay zeka girişimi bir çocuk ve bir bilgisayarla başlayabilir ama Avrupa’da o çocuğun yanında on iki avukat gerekir
  Mistral’ın önden başlamasına, çok umut veren ilk modellerine ve aldığı yatırıma rağmen görünmez hale gelmesi, tüm bu düzenlemelere uymaya çalışmasının sonucu olabilir
- Teknik farkın fazla açılması derken ne kastedildiğini anlamıyorum. Öncülük etmektense yakalamak daha kolay ve daha ucuz değil mi?
- Mixture-of-experts (MoE) konusunda, MoE’nin pratik işe yararlılığını ilk gösteren model olarak Mixtral aklımda kalmış
  Teknik raporundan çok etkilenmiştim. Tabii MoE fikrinin kendisi zaten daha önceden vardı diye biliyorum
  Mixtral model ailesini daha fazla zorlasalardı, bugünkü Qwen serisine benzer bir itibar kazanmış olabilirlerdi. Kaçırılmış bir fırsat
- Birleşik Krallık hükümeti yakın zamanda yapay zeka araştırmalarına 10 milyon sterlin ayırdığını açıkladı ama muhtemelen bunun çoğunu danışmanlar alacak
  Bununla kıyaslayınca Avrupa bence oldukça iyi durumda
BNP Paribas, Belçika'da KYC için Mistral modellerini on-premise çalıştırıyor ve hassas verilerin bankanın içinde kalması önemli
Abanca da uygulamadaki 2 milyon müşterinin hassas verileri gibi büyük ölçekli müşteri bilgilerini işlemek için ajan orkestrasyonu kullanıyor
Düzenlemeye tabi sektörlerdeki Avrupalı şirketler için bu, ABD'li hyperscaler'lara bağımlı olmaktan daha iyi bir alternatif ve Mistral'ın on-premise ile Avrupa barındırmalı modellere odaklanması çok akıllıca bir yön
- Kibarca söylemek gerekirse buna “çok” akıllıca demezdim. Seçeneklerin sınırlı olduğu bir durumda iyi bir seçenek sadece
  Herkes full-deployment engineering ya da müşteriye özel engineering yapıyor; aksi halde sadece token maliyetinin üstüne marj koyan bir şirket gibi görünüyorlar
  O zaman parayı Neo-SaaS şirketleri alır. Mistral'ın yapay zekasını başka kim satın alırdı ve başka hangi seçenek vardı ki
- Mistral'ın Koyeb satın alımı ile büyük ölçekli deployment uzmanlığını güçlendirmesi de tam yerinde bir hamleydi
- Mistral'ın kod, görsel, video gibi içerik üretimine odaklandığını sanmıyorum
  Bunun yerine çok dilli modeller, OCR, ses gibi başka alanlara odaklanıyor gibi görünüyor
  Model tanıtım sayfası da bunu gösteriyor ama o kadar renkli ve kategoriyle model adı o kadar fazla ki insanın kafası hep karışıyor
  Umarım verdikleri karar iyi sonuç verir
- B2C'yi ya da dünya ölçeğinde SaaS pazarını bıraktıktan sonra AB girişimlerinin sık gittiği yol bu değil mi? Büyük Avrupa şirketlerine B2B ve devlet sözleşmelerine yeniden odaklanmak
  Avrupa girişimleri için kurumsal B2B bana hep ölmeye gidilen yer gibi gelmiştir
- Yine de Mistral'ı on-premise kullanmak için sebep ne? Qwen yerine yani
Etkinliğe katıldım; katılımcı ölçeği etkileyiciydi ve büyük Avrupa halka açık şirketlerinin liderleri oradaydı
Davet edilen partner sayısının çokluğu da ilginçti. Microsoft, Accenture, EY'den alpic.ai ve lingo.dev gibi girişimlere kadar uzanıyordu
M&A tarafındaki hareketlerini de artırıyor gibiler
İşten bağımsız olarak web sitesi tasarımı gerçekten harika: https://mistral.ai/
- Fazla karmaşık görünüyor ve paragraf yerleşimi de kaymış
- Neyi özellikle iyi bulduğunu anlamadım. Telefonda kaydırdım; oldukça sıradan bir kurumsal web sitesi gibi görünüyor
- Mistral'ın markalamasını tamamen beğeniyorum
Mistral'dan bir e-posta geldi; devstral gibi bazı, belki de çoğu özel modeli ağustosa kadar kademeli olarak sonlandıracaklarını ve artık genel amaçlı modelleri kullanmamızı söylüyorlar
Maliyetler üstel şekilde artıyor
Devstral 2'den (devstral-2512 ve devstral-latest) daha güçlü model olan Mistral Medium 3.5'e (mistral-medium-3-5, reasoning_effort değeri "high" olacak şekilde) geçmemizi önerdiklerini yazmışlar; fiyat ise giriş/çıkışta milyon token başına $1.5/$7.5
Önceki $0.4/$2 fiyatından değişmiş
- Aynı e-postayı aldım ama her şeyi zaten Mistral-Medium-3.5'e taşıdığımı sanıyordum; bu yüzden hâlâ hangi sonlandırılacak modeli kullandığımdan pek emin değilim
  Her hâlükârda e-postayı alınca, bunun önümüzdeki birkaç ay içinde yeni ve geliştirilmiş modeller de çıkaracaklarına dair bir işaret olmasını umdum
Hiç hendek yokmuş gibi görünüyor. Veri merkezi olan bir yazılım danışmanlık şirketi gibi
Üstelik yazıda birçok müşterinin bu modelleri on-premise kullandığı söyleniyor; yani veri merkezi de pek bir avantaj sayılmaz
Devlet destekli herhangi bir girişimin küçük açık kaynak modelleri fine-tune etmesini engelleyen şey ne
- Belki de, doğrudan kontrol ettiğiniz daha büyük modellerden küçük modellere distillation yaparsanız, kontrol etmediğiniz daha büyük modellere dayanarak fine-tune etmekten daha iyi küçük modeller çıkarabileceğiniz içindir
  Bunun doğru olduğunu iddia etmiyorum; sadece böyle bir varsayım kurulabilir diyorum
Bir Avrupalı olarak buna 100 kat katılıyorum
Bu oyuncular arasında Mistral'ın yönünü ve şeffaflığını gerçekten seviyorum
- Avrupalı olmasanız bile, ABD ve Çin modellerine karşı bir Avrupalı rakip görmek iyi bir şey
Abanca'nın uygulamadaki 2 milyon müşterinin “muazzam ölçekteki” hassas müşteri verilerini işlemek için ajan orkestrasyonu kullandığını söylüyorlar ama benim muazzam ölçek ölçümüm mü bozuk bilmiyorum
2 milyon kullanıcı demek birkaç yüz MB veri falan değil mi? Kullanıcı başına çok veri olsa bile birkaç GB eder gibi geliyor
- Olabilir ama en yeni büyük dil modelleriyle müşteri destek taleplerini ajan yaklaşımıyla çözerseniz token tüketimi hızla artar
  Sunumdan anladığım kadarıyla, sınırlı sorumlulukları olan ajanlar ve muhtemelen daha küçük modeller kullanarak yanıtları hızlı, güvenilir ve maliyeti çok yüksek olmayacak şekilde kurmuşlar
- Avrupa'daki tüketici odaklı şirketler, ABD şirketleri kadar kolay ölçeklenemiyor; bu da Avrupa'nın genel olarak teknoloji şirketlerini büyütürken yaşadığı sorunun büyük bir nedeni
  Buna karşılık bu tür işler epey savunulabilir olabilir ama genelde aynı ölçüde yüksek kârlılığa dönüşmez

Mistral AI Now Summit notları

Mistral’ın konumlanması

Ürün stratejisi ve kullanım örnekleri

Ajan sistemleri ve harness

Küçük ve uzmanlaşmış modeller

Egemenlik ve şirket içi dağıtım

Beşeri bilimlerde kullanım

Avrupa yapay zeka iş ortağı stratejisi

İlgili okumalar

1 yorum

Hacker News görüşleri