Mistral AI Now Summit notları
(koenvangilst.nl)- Mistral, yalnızca bir model şirketi olmanın ötesine geçerek compute, model, platform ve danışmanlığı bir araya getiren uçtan uca bir yapay zeka yığını şirketi olma yönünde ilerliyor
- Paris’teki 40MW veri merkezi ve ek veri merkezi planlarıyla, müşterinin sahip olabildiği ve şirket içinde çalıştırılabilen açık, özelleştirilebilir modellerle farklılaşıyor
- Yeni model duyurularından çok iş ortaklıkları öne çıktı; ASML, BNP Paribas, Amazon Alexa+ iş birlikleri ve Vibe for Work’ün tanıtımı öne çıkan başlıklardı
- Ajan sistemlerinde harness, bağlam, kalıcılık ve öğrenme eklerken; muhakeme, hata toparlama ve şeffaflığın korunmasında temel unsur olarak ele alınıyor
- Küçük ve uzmanlaşmış modeller ile şirket içi dağıtım, regülasyona tabi sektörler ve Avrupalı şirketler için konumlanan bir strateji; odak AGI yarışından çok somut yatırım getirisi
Mistral’ın konumlanması
- Mistral, bir model şirketi olarak kalmak yerine compute, model, platform ve danışmanlığı kapsayan uçtan uca bir yapay zeka yığını kurma yönünde ilerliyor
- Paris’te 40MW veri merkezi bulunuyor ve İsveç dahil ek veri merkezleri de planlanıyor
- Anthropic veya OpenAI’den ayrıştığı nokta, verimli, açık ve özelleştirilebilir modellerin müşteri tarafından sahiplenilebilmesi ve şirket içinde çalıştırılabilmesi
- Etkinliğin mesajı, yeni modeller veya teknik atılımlardan çok iş ortaklıklarına ağırlık verdi
- ASML, BNP Paribas, Amazon Alexa+ iş birlikleri, gerçek sorunların yapay zeka ile çözülmesine örnek olarak ele alındı
- Vibe for Work tanıtıldı; Claude for Work’e benzer bir ürün olarak sunuldu
Ürün stratejisi ve kullanım örnekleri
-
Ajan sistemleri ve harness
- Yalnızca model yeterli değil; harness, bağlam, kalıcılık ve öğrenme ekleme görevini üstleniyor
- Muhakeme (reasoning), sistemin geri dönmesini, hatalardan toparlanmasını ve şeffaflığını korumasını sağlayan temel unsur olarak ele alınıyor
- Kurumsal en iyi uygulamalar beceriler (skills) olarak yakalanıyor ve yapay zeka ajanlarıyla birlikte çalışma sürecinde gelişiyor
-
Küçük ve uzmanlaşmış modeller
- Mistral, küçük, hızlı ve odağı net modellerin enerji verimliliği ve hızda büyük genel amaçlı modelleri geride bıraktığı örnekler sunuyor
- Document AI, OCR için bir model ve EU Patent Office bunu büyük ölçekli OCR için kullanıyor
- Voxtral, çok dilli bir ses modeli ve Avrupa’da Amazon Alexa+’ı çalıştırmak için kullanılıyor
- Robostral, ASML ile endüstriyel robotik alanında kullanılıyor
- Token kullanımı yüksek ajan tabanlı uygulamalarda yalnızca ham performans değil, hız ve verimlilik de önemli hale geliyor
-
Egemenlik ve şirket içi dağıtım
- BNP Paribas, Belçika’da KYC amacıyla Mistral modellerini şirket içinde çalıştırıyor ve hassas verileri banka içinde tutuyor
- Abanca, uygulama içinde 1 milyondan fazla müşterinin hassas bilgilerini büyük ölçekte işlemek için ajan orkestrasyonu kullanıyor
- Regülasyona tabi sektörlerdeki Avrupalı şirketler için bu, ABD’li hyperscaler’lara bağımlılığı azaltan bir alternatif olabilir
-
Beşeri bilimlerde kullanım
- Austrian Academy of Sciences araştırma ekibi, Mistral’ın kodlama LLM’i Codestral’ı fine-tune ederek binlerce yıllık papirüs parçalarını okuyabilir hale getirdi
- Bu çalışma, Mısır çölünde bulunan 180 bin belge koleksiyonunu erişilebilir kılmaya katkı sağlıyor
- Yapay zeka olmasaydı 2.000 yıldan fazla sürecek bir iş olarak sunuluyor
- Austrian Academy of Sciences’in Apollo projesi, yapay zekanın beşeri bilimlere de katkı sağlayabileceğini gösteren bir örnek
-
Avrupa yapay zeka iş ortağı stratejisi
- Mistral’ın vizyonu, AGI yarışını kazanmaktan çok bugün somut yatırım getirisi sunan bir Avrupa tam yığın yapay zeka iş ortağı olmaya daha yakın
- Bu stratejinin başarısı, daha fazla Avrupalı şirketin Mistral’ın yaklaşımını benimseyip benimsemeyeceğine bağlı
- Açık modeller, şirket içi dağıtım ve kurumsal iş ortaklıklarının birleşimi, AB’deki birçok büyük kuruluş için cazip olabilir
- ABD’li teknoloji devlerine körü körüne bağımlı olunan dönem sona eriyor; önemli olan, artık ciddi bir Avrupalı yapay zeka oyuncusunun ortaya çıkmış olması
Seçilmiş teknoloji başlıklarını almaya devam etmek ister misiniz?
Telegram kanalını takip edin. @GeekNewsTR
1 yorum
Hacker News görüşleri
Mistral ve göreve özel küçük modelleri gerçekten destekliyorum ama Mistral, 2025’in 3. çeyreğinden beri fazlasıyla geride kaldı
Artık rekabet edebilmek için orta düzey bağlam uzunluklarında bile iyi çıkarım modelleri çalıştırabilmek gerekiyor, ama Mistral bunu yapamıyor gibi görünüyor
Şu anda küçük model tarafında Gemma4 ve Qwen3.6 en iyileri ve Mistral’ın “small” modeli 120B ile yaklaşık 4 kat daha fazla parametreye sahip olmasına rağmen dörtte biri büyüklüğündeki modellerle bile düzgün şekilde rekabet edemiyor
Bir yıl önce Mistral Small 3.1 döneminde tempoyu koruyordu ama şimdi neredeyse tamamen görünmez hale gelmiş durumda
Mistral, şirket içi kurulumlar ve göreve özel küçük model pazarını gerçekten hedefliyorsa, r/localLlama tarafındaki insanların heyecanlanacağı modeller üretmek oldukça iyi bir vekil gösterge olabilir
Konferansta yeni modellerden pek söz edilmemesi de endişe verici. Bana göre asıl odaklanmaları gereken konu tam da bu
Önlerini neyin kestiğini merak ediyorum. Para mı, hesaplama kaynağı mı, yetkinlik mi, eğitim verisi mi, bilmiyorum
Gerçekten iyi modeller yapmak için frontier model çıktıları gibi epey şüpheli verilerle eğitim yapmak gerekiyor ama Mistral fazla Avrupai ve kurumsal müşteri odaklı olduğu için bu riski alamıyor olabilir diye korkuyorum
Sonunda Dailymotion gibi zombi bir şirkete dönüşecek gibi
Mesela Claude Code’da varsayılan olarak kullanılan, Opus’un yazılıma özel bir alt kümesi gibi bir modeli düşünüyorum
Daha küçük olur, dağıtımı ve kullanımı daha ucuz olur, belki daha da hızlı olabilir
O noktada Mistral’ın hazır olması gerekir ama son dönemdeki performansa bakınca gerçekçi olarak beklentim yüksek değil
Mistral 4’te token başına etkin parametre sayısı 6B olduğundan, bir 4090 üzerinde token başına 3~3.5 parametre sığdırılabilse bile yaklaşık 240GB indirme ve depolama gereksinimi yerelde denemek için sınırda kalıyor
Birden fazla modeli indirip değerlendirme durumunda bu daha da geçerli ve diğer insanların, eski Mistral/Magistral modellerinde olduğu gibi, sonradan fine-tuning üretmesini de zorlaştırıyor
Harika bir kamu BT yöneticisinin konuşmasını dinledim; modelleri değerlendiriyordu ve mevcut durumdan oldukça memnuniyetsizdi
Mistral kullanmak istiyor ve bazı durumlarda kullanılabilecek tek AB tabanlı model de bu, ama performansının gerçekten kötü olduğunu ve giderek daha fazla geride kaldığını da biliyor
Mistral, kötü olsa bile AB kullanım senaryolarında tek uygulanabilir model olma gerekçesiyle kârlı bir iş kurabilir belki. Üzücü bir durum ve izlemek can sıkıcı
Avrupa’nın yapay zeka geliştirme ve araştırmasına katılmasını gerçekten istiyorum ve Mistral’ı da güçlü biçimde destekledim
Ama teknik fark çok fazla açılıyor. Bu düzeltilemezse, Avrupa’nın iyi sonuçlarla büyük teknoloji şirketleri işletemediğine dair bir kanıt daha olacak
Esasen Çin’deki laboratuvarların neredeyse hepsi çok daha iyi iş çıkarıyor. DeepSeek’ten söz etmesek bile MiMo 2.5 ve Minimax 2.7 gibi şeyleri yapan Mistral değildi
Mistral tarafındaki modeller ya daha zayıf, ya daha büyük ve yavaş, ya da mixture-of-experts (MoE) içermeyen modeller; bu da iyi değil
Avrupa, kitlesel histerinin zirvede olduğu dönemde alelacele hazırlanmış bu yasayla kendi ayağına sıktı ve artık aklı başında hiçbir şirket orada bir şey inşa etmeye çalışmayacaktır
ABD ya da Çin’de bir yapay zeka girişimi bir çocuk ve bir bilgisayarla başlayabilir ama Avrupa’da o çocuğun yanında on iki avukat gerekir
Mistral’ın önden başlamasına, çok umut veren ilk modellerine ve aldığı yatırıma rağmen görünmez hale gelmesi, tüm bu düzenlemelere uymaya çalışmasının sonucu olabilir
Teknik raporundan çok etkilenmiştim. Tabii MoE fikrinin kendisi zaten daha önceden vardı diye biliyorum
Mixtral model ailesini daha fazla zorlasalardı, bugünkü Qwen serisine benzer bir itibar kazanmış olabilirlerdi. Kaçırılmış bir fırsat
Bununla kıyaslayınca Avrupa bence oldukça iyi durumda
BNP Paribas, Belçika'da KYC için Mistral modellerini on-premise çalıştırıyor ve hassas verilerin bankanın içinde kalması önemli
Abanca da uygulamadaki 2 milyon müşterinin hassas verileri gibi büyük ölçekli müşteri bilgilerini işlemek için ajan orkestrasyonu kullanıyor
Düzenlemeye tabi sektörlerdeki Avrupalı şirketler için bu, ABD'li hyperscaler'lara bağımlı olmaktan daha iyi bir alternatif ve Mistral'ın on-premise ile Avrupa barındırmalı modellere odaklanması çok akıllıca bir yön
Herkes full-deployment engineering ya da müşteriye özel engineering yapıyor; aksi halde sadece token maliyetinin üstüne marj koyan bir şirket gibi görünüyorlar
O zaman parayı Neo-SaaS şirketleri alır. Mistral'ın yapay zekasını başka kim satın alırdı ve başka hangi seçenek vardı ki
Bunun yerine çok dilli modeller, OCR, ses gibi başka alanlara odaklanıyor gibi görünüyor
Model tanıtım sayfası da bunu gösteriyor ama o kadar renkli ve kategoriyle model adı o kadar fazla ki insanın kafası hep karışıyor
Umarım verdikleri karar iyi sonuç verir
Avrupa girişimleri için kurumsal B2B bana hep ölmeye gidilen yer gibi gelmiştir
Etkinliğe katıldım; katılımcı ölçeği etkileyiciydi ve büyük Avrupa halka açık şirketlerinin liderleri oradaydı
Davet edilen partner sayısının çokluğu da ilginçti. Microsoft, Accenture, EY'den alpic.ai ve lingo.dev gibi girişimlere kadar uzanıyordu
M&A tarafındaki hareketlerini de artırıyor gibiler
İşten bağımsız olarak web sitesi tasarımı gerçekten harika: https://mistral.ai/
Mistral'dan bir e-posta geldi; devstral gibi bazı, belki de çoğu özel modeli ağustosa kadar kademeli olarak sonlandıracaklarını ve artık genel amaçlı modelleri kullanmamızı söylüyorlar
Maliyetler üstel şekilde artıyor
Devstral 2'den (devstral-2512 ve devstral-latest) daha güçlü model olan Mistral Medium 3.5'e (mistral-medium-3-5,
reasoning_effortdeğeri "high" olacak şekilde) geçmemizi önerdiklerini yazmışlar; fiyat ise giriş/çıkışta milyon token başına $1.5/$7.5Önceki $0.4/$2 fiyatından değişmiş
Her hâlükârda e-postayı alınca, bunun önümüzdeki birkaç ay içinde yeni ve geliştirilmiş modeller de çıkaracaklarına dair bir işaret olmasını umdum
Hiç hendek yokmuş gibi görünüyor. Veri merkezi olan bir yazılım danışmanlık şirketi gibi
Üstelik yazıda birçok müşterinin bu modelleri on-premise kullandığı söyleniyor; yani veri merkezi de pek bir avantaj sayılmaz
Devlet destekli herhangi bir girişimin küçük açık kaynak modelleri fine-tune etmesini engelleyen şey ne
Bunun doğru olduğunu iddia etmiyorum; sadece böyle bir varsayım kurulabilir diyorum
Bir Avrupalı olarak buna 100 kat katılıyorum
Bu oyuncular arasında Mistral'ın yönünü ve şeffaflığını gerçekten seviyorum
Abanca'nın uygulamadaki 2 milyon müşterinin “muazzam ölçekteki” hassas müşteri verilerini işlemek için ajan orkestrasyonu kullandığını söylüyorlar ama benim muazzam ölçek ölçümüm mü bozuk bilmiyorum
2 milyon kullanıcı demek birkaç yüz MB veri falan değil mi? Kullanıcı başına çok veri olsa bile birkaç GB eder gibi geliyor
Sunumdan anladığım kadarıyla, sınırlı sorumlulukları olan ajanlar ve muhtemelen daha küçük modeller kullanarak yanıtları hızlı, güvenilir ve maliyeti çok yüksek olmayacak şekilde kurmuşlar
Buna karşılık bu tür işler epey savunulabilir olabilir ama genelde aynı ölçüde yüksek kârlılığa dönüşmez