- Robotik alanı 2025'te şimdiye kadarki en yüksek yatırım seviyesi olan 40,7 milyar dolar çekti; bu, yıllık bazda %74 artış anlamına geliyor ve toplam girişim sermayesinin %9'unu oluşturarak yapay zeka yazılımlarıyla birlikte yatırımın öncü alanlarından biri haline geldi
- Physical/fiziksel AI, robotların önceden programlanmış kurallar yerine veriden öğrenerek fiziksel dünyada çalışabilmesini sağlayan temel teknoloji
- Dil modellerinin aksine, physical AI modelleri gerçek robot verisi gerektiriyor; bu da pazar kontrolü için erken konum alma fırsatı yaratıyor
- 10 physical AI model kategorisinde 70'ten fazla şirket, veri ve simülasyon, model yaklaşımları, foundation model'ler ve observability alanlarında rekabet ediyor
- Çoklu robot iş birliği, physical AI'nin çözülmemiş temel sorunu olmaya devam ediyor; bunu ilk çözen şirketin otonom robot filolarının endüstriyel ölçeklenmesine liderlik etmesi bekleniyor
Temel çıkarımlar
- Özel eğitim verisi, physical AI'de temel rekabet avantajı olarak öne çıkıyor; büyük teknoloji şirketleri satın almalar yoluyla veri erişimini güvence altına almaya çalışıyor
- Nvidia, 2025 Mart ayında sentetik veri sağlayıcısı Gretel'i 320 milyon doların üzerinde bir bedelle satın aldı
- Meta, veri altyapısı ve model geliştirme şirketi Scale'e 14,8 milyar dolarlık özsermaye yatırımı yaptı
- OpenAI, eğitim verisi sağlamak için Medal'ı satın almaya çalıştı ancak Medal, bu verilerle model geliştiren General Intuition'ı başlattı
- Özel eğitim verisini elinde bulunduran şirketler daha iyi modeller geliştirebilirken, rakipler lisanslı erişime bağımlı kalıyor
- Çeşitli ve yüksek kaliteli eğitim verisini erkenden güvence altına almak, ticari ölçeğe ulaşmanın anahtarı
- World model'ler, robotların otonom biçimde tahmin ve planlama yapmasını sağlıyor; bu, büyük dil modellerinin (LLM) başaramadığı bir yetenek
- World model yatırımları 2024'te 1,4 milyar dolardan 2025'te 6,9 milyar dolara sıçradı
- Bu alandaki şirketlerin ortalama Mosaic skoru 722 (genel pazarın en üst %3'lük dilimi)
- Başarı için kontrollü ortamlardan elde edilen yüksek kaliteli eğitim verisi ve donanım üreticileriyle yakın ortaklıklar gerekiyor
- Çoklu robot iş birliği, physical AI'nin temel çözülmemiş sorunu olarak kalıyor
- ABD şirketleri 17 anlaşmada 17 milyar doların üzerinde yatırım topladı
- Çinli şirketler 15 anlaşmada 416 milyon dolar yatırım topladı
- Her iki bölgedeki şirketler de neredeyse tamamen tek robot yeteneklerine odaklanırken, farklı robot türlerinin birlikte çalışması için gereken orkestrasyon katmanını kuran şirket sayısı az
- İş birliği sorununu ilk çözen şirket, otonom robot filolarının endüstriyel genişlemesini kontrol edebilir
Kategori özeti
-
Veri ve simülasyon
- Robot eğitiminin temelini oluşturur; robotlar büyük miktarda eğitim verisine ihtiyaç duyar, ancak gerçek veri toplamak yavaş ve maliyetlidir
- Üç alt pazardan oluşur:
- Sentetik eğitim verisi — robotik: pahalı gerçek dünya toplama süreçlerine gerek kalmadan görüntüler, sensör verileri ve 3B sahneler gibi sentetik veri setleri üreten araçlar
- Robot gösterim verisi sağlayıcıları: taklit öğrenimi için teleoperasyon verisi, hareket yörüngeleri ve video gibi gerçek verileri yakalayan şirketler
- Robotik simülasyon platformları: fiziksel dağıtımdan önce robotları eğitmek, test etmek ve doğrulamak için sanal ortamlar
- Veri kıtlığı, physical AI'nin başlıca darboğazı; maliyet ve erişilebilirlik sorunları nedeniyle gerçek eğitim verisine ulaşmak zor
- Bu pazarların ortalama Mosaic skoru yaklaşık 600 (pazar momentumunda üst yarı)
- Şirketlerin %50'si dağıtım aşamasına geçmiş durumda; bu da physical AI için veri altyapısının araştırma aşamasını aşıp ticari uygulanabilirliğe olgunlaştığını gösteriyor
- Pek çok şirket sentetik veri ve simülasyona dayanıyor; pazara Nvidia liderlik ediyor
- Ancak yalnızca sentetik veri yeterli değil; güvenilir model eğitimi için gerçek robot verisi hâlâ kritik
- Scale, 16,4 milyar dolarlık yatırımla Mosaic skorunda en üst %1'lik dilimde yer alıyor
- Scale, sentetik veri üretimi ile gerçek veri toplamayı (robotların insanlar tarafından uzaktan kontrol edilmesi ve fiziksel ortamlardan sensör verisi toplanması dahil) birleştirerek veri etiketleme işini model geliştirmeye genişletti
- Yükselen şirketler, mevcut veri açığını aşmak için yeni veri kaynaklarının peşinde
- General Intuition, robot sistemlerine uygulanabilecek oyun oynanış videolarıyla model eğitmek için 134 milyon dolar yatırım aldı
- micro1, 500 milyon dolar değerleme üzerinden 35 milyon dolar yatırım alarak insan etkileşimi videolarından dünyanın en büyük robotik eğitim veri setini kuruyor
- Özel veri setleri veya simülasyon platformları olmadan robotik şirketleri, önde gelen oyunculardan lisans almak ya da dokunma, basınç ve fiziksel hareket gibi kritik veri türlerinde geri kalmak riskiyle karşı karşıya
-
Modellere yaklaşım
- Robotlara görme, akıl yürütme ve hareket yetenekleri kazandırır; her model başka modellerin üzerine inşa edilir
- Katı programlama yerine yeni görevlere uyum sağlamalarını mümkün kılar
- Üç alt pazardan oluşur:
- Vision-language model (VLM) geliştiricileri: görsel anlayış ile doğal dili birleştiren çok modlu modeller; robotların algı katmanı olarak işlev görür
- Vision-language-action (VLA) model geliştiricileri: VLM'ler üzerine kurulan, görsel algı, dil anlama ve motor kontrolünü birleştirerek komutları doğrudan fiziksel eyleme dönüştüren yapay zeka sistemleri
- World model AI geliştiricileri: mekânsal ilişkileri, fizik kurallarını ve nedenselliği tahmin etmek için çevredeki değişimleri simüle eden modeller
- Physical AI, robotiği sabit kodlanmış programlamadan esnek ve göreve uyarlanabilir sistemlere dönüştürüyor; VLA modelleri de önde gelen mimari olarak yükseliyor
- Figure, 1X, Galbot gibi önde gelen insansı robot şirketleri özel VLA modelleri geliştiriyor
- Nvidia ve Meta gibi büyük teknoloji şirketleri, robot üreticilerine ticari lisanslama için modeller geliştiriyor
- World model'ler, öngörüsel akıl yürütme ekleyerek asıl kırılma noktası olabilir
- World Labs ve Runway gibi şirketler world model'ler geliştiriyor
- VLA'ler anlık girdilere tepki verirken, world model'ler çevrenin zaman içindeki değişimini simüle eder
- Böylece robotlar sonuçları tahmin edebilir, çok adımlı eylemler planlayabilir ve hatalardan toparlanabilir
-
Foundation model'ler
- Veri ve mimariyi birleştirerek algılama, akıl yürütme ve eylem kapasitesine sahip önceden eğitilmiş robot zekâsı sunar
- Bazıları manipülasyon için genel amaçlıdır, bazıları ise özelleşmiştir
- Geliştiriciler bu zekâyı sıfırdan kurmak yerine lisanslayıp uygulayabilir
- Üç alt pazardan oluşur:
- Robot foundation model geliştiricileri: farklı donanımlar üzerinde robotların görmesine, düşünmesine ve hareket etmesine yardımcı olan genel amaçlı modeller
- Otonom sürüş foundation model geliştiricileri: büyük sürüş veri setleriyle eğitilen; algılama, tahmin, planlama ve kontrolü birleştirerek robotaksi, kamyon taşımacılığı ve teslimat için mevcut otonom sistemlerin yerini alan modeller
- Çoklu robot iş birliği model geliştiricileri: görev dağıtımı, çarpışmadan kaçınma ve dağıtık karar almayı ele alarak robot sürülerinin birlikte çalışmasını sağlayan çok etmenli algoritmalar
- Foundation model pazarı son derece dinamik
- ABD'li teknoloji devleri (Microsoft, Google, Amazon) ile Çinli liderler (Huawei, Baidu), DeepSeek ve Physical Intelligence gibi dikkat çeken girişimlerle rekabet ediyor
- Birçok şirket birden fazla foundation model türü üzerinde çalışıyor
- Bir alandaki eğitim verisi, başka bir alandaki model performansını artırmaya katkı sağlayabilir
- Nvidia, üç foundation model kategorisinin tamamında aktif olan tek şirket olarak tüm physical AI yığınının altyapısı konumuna yerleşiyor
- Çoklu robot iş birliği bir sonraki frontier
- Depoda insansı robotların, otonom mobil robotların ve otonom forkliftlerin birlikte çalıştığı senaryolar gibi
- Farklı robot türleri arasındaki iş birliği için, merkezi kontrol olmadan görevleri, kaynakları ve çarpışmadan kaçınmayı yöneten bir orkestrasyon katmanı gerekiyor
- Bunu yalnızca birkaç girişim (Field AI, Intrinsic) ve bazı büyük teknoloji şirketleri takip ediyor
- Çalışmaların çoğu ticari dağıtımdan ziyade araştırma aşamasında kalıyor
- Özel modellere sahip şirketler, farklılaşma ve dikey entegrasyon yoluyla daha yüksek marj elde edebilir
- Üçüncü taraf yapay zekâyı lisanslayan şirketler, modelin metalaşmasıyla düşen maliyetlerden yararlanabilir; ancak temel teknoloji yerine dağıtım hızı ve entegrasyon kalitesiyle rekabet eder
-
Gözlemlenebilirlik (Observability)
- Robotların üretim ortamında çalışırken neler yaşadığını yakalayarak laboratuvar geliştirmesi ile gerçek dağıtım arasındaki boşluğu kapatır
- Robotik gözlemlenebilirlik platformları: geliştirme ve üretim süreçlerinde robotları izlemek, hata ayıklamak ve optimize etmek için kullanılan platformlar
- Robotlar arızalandığında veya beklenmedik şekilde davrandığında, mühendisler olayı yeniden oynatıp kök nedeni belirleyebilir ve düzeltmeleri yayına alabilir
- Gerçek edge case'ler simülasyon ve eğitime geri beslenerek modellerin iyileştirilmesini ve performansın artmasını sağlar
- Foxglove ve Formant bunun öne çıkan örnekleri; performansı izler, hataları analiz eder ve dağıtım içgörülerini eğitim veri setlerine, simülasyona ve modellere geri besler
- Güçlü gözlemlenebilirliğe sahip şirketler, hatalardan öğrenerek modellerini hızla iyileştirebilir
- Beklenmeyen durumlar, üretime hazır sistemleri laboratuvar prototiplerinden ayıran temel unsur olarak bir öğrenme avantajına dönüşür
Henüz yorum yok.