7 puan yazan GN⁺ 2026-01-30 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Robotik alanı 2025'te şimdiye kadarki en yüksek yatırım seviyesi olan 40,7 milyar dolar çekti; bu, yıllık bazda %74 artış anlamına geliyor ve toplam girişim sermayesinin %9'unu oluşturarak yapay zeka yazılımlarıyla birlikte yatırımın öncü alanlarından biri haline geldi
  • Physical/fiziksel AI, robotların önceden programlanmış kurallar yerine veriden öğrenerek fiziksel dünyada çalışabilmesini sağlayan temel teknoloji
  • Dil modellerinin aksine, physical AI modelleri gerçek robot verisi gerektiriyor; bu da pazar kontrolü için erken konum alma fırsatı yaratıyor
  • 10 physical AI model kategorisinde 70'ten fazla şirket, veri ve simülasyon, model yaklaşımları, foundation model'ler ve observability alanlarında rekabet ediyor
  • Çoklu robot iş birliği, physical AI'nin çözülmemiş temel sorunu olmaya devam ediyor; bunu ilk çözen şirketin otonom robot filolarının endüstriyel ölçeklenmesine liderlik etmesi bekleniyor

Temel çıkarımlar

  • Özel eğitim verisi, physical AI'de temel rekabet avantajı olarak öne çıkıyor; büyük teknoloji şirketleri satın almalar yoluyla veri erişimini güvence altına almaya çalışıyor
    • Nvidia, 2025 Mart ayında sentetik veri sağlayıcısı Gretel'i 320 milyon doların üzerinde bir bedelle satın aldı
    • Meta, veri altyapısı ve model geliştirme şirketi Scale'e 14,8 milyar dolarlık özsermaye yatırımı yaptı
    • OpenAI, eğitim verisi sağlamak için Medal'ı satın almaya çalıştı ancak Medal, bu verilerle model geliştiren General Intuition'ı başlattı
    • Özel eğitim verisini elinde bulunduran şirketler daha iyi modeller geliştirebilirken, rakipler lisanslı erişime bağımlı kalıyor
    • Çeşitli ve yüksek kaliteli eğitim verisini erkenden güvence altına almak, ticari ölçeğe ulaşmanın anahtarı
  • World model'ler, robotların otonom biçimde tahmin ve planlama yapmasını sağlıyor; bu, büyük dil modellerinin (LLM) başaramadığı bir yetenek
    • World model yatırımları 2024'te 1,4 milyar dolardan 2025'te 6,9 milyar dolara sıçradı
    • Bu alandaki şirketlerin ortalama Mosaic skoru 722 (genel pazarın en üst %3'lük dilimi)
    • Başarı için kontrollü ortamlardan elde edilen yüksek kaliteli eğitim verisi ve donanım üreticileriyle yakın ortaklıklar gerekiyor
  • Çoklu robot iş birliği, physical AI'nin temel çözülmemiş sorunu olarak kalıyor
    • ABD şirketleri 17 anlaşmada 17 milyar doların üzerinde yatırım topladı
    • Çinli şirketler 15 anlaşmada 416 milyon dolar yatırım topladı
    • Her iki bölgedeki şirketler de neredeyse tamamen tek robot yeteneklerine odaklanırken, farklı robot türlerinin birlikte çalışması için gereken orkestrasyon katmanını kuran şirket sayısı az
    • İş birliği sorununu ilk çözen şirket, otonom robot filolarının endüstriyel genişlemesini kontrol edebilir

Kategori özeti

  • Veri ve simülasyon

    • Robot eğitiminin temelini oluşturur; robotlar büyük miktarda eğitim verisine ihtiyaç duyar, ancak gerçek veri toplamak yavaş ve maliyetlidir
    • Üç alt pazardan oluşur:
      • Sentetik eğitim verisi — robotik: pahalı gerçek dünya toplama süreçlerine gerek kalmadan görüntüler, sensör verileri ve 3B sahneler gibi sentetik veri setleri üreten araçlar
      • Robot gösterim verisi sağlayıcıları: taklit öğrenimi için teleoperasyon verisi, hareket yörüngeleri ve video gibi gerçek verileri yakalayan şirketler
      • Robotik simülasyon platformları: fiziksel dağıtımdan önce robotları eğitmek, test etmek ve doğrulamak için sanal ortamlar
    • Veri kıtlığı, physical AI'nin başlıca darboğazı; maliyet ve erişilebilirlik sorunları nedeniyle gerçek eğitim verisine ulaşmak zor
      • Bu pazarların ortalama Mosaic skoru yaklaşık 600 (pazar momentumunda üst yarı)
      • Şirketlerin %50'si dağıtım aşamasına geçmiş durumda; bu da physical AI için veri altyapısının araştırma aşamasını aşıp ticari uygulanabilirliğe olgunlaştığını gösteriyor
    • Pek çok şirket sentetik veri ve simülasyona dayanıyor; pazara Nvidia liderlik ediyor
      • Ancak yalnızca sentetik veri yeterli değil; güvenilir model eğitimi için gerçek robot verisi hâlâ kritik
      • Scale, 16,4 milyar dolarlık yatırımla Mosaic skorunda en üst %1'lik dilimde yer alıyor
      • Scale, sentetik veri üretimi ile gerçek veri toplamayı (robotların insanlar tarafından uzaktan kontrol edilmesi ve fiziksel ortamlardan sensör verisi toplanması dahil) birleştirerek veri etiketleme işini model geliştirmeye genişletti
    • Yükselen şirketler, mevcut veri açığını aşmak için yeni veri kaynaklarının peşinde
      • General Intuition, robot sistemlerine uygulanabilecek oyun oynanış videolarıyla model eğitmek için 134 milyon dolar yatırım aldı
      • micro1, 500 milyon dolar değerleme üzerinden 35 milyon dolar yatırım alarak insan etkileşimi videolarından dünyanın en büyük robotik eğitim veri setini kuruyor
    • Özel veri setleri veya simülasyon platformları olmadan robotik şirketleri, önde gelen oyunculardan lisans almak ya da dokunma, basınç ve fiziksel hareket gibi kritik veri türlerinde geri kalmak riskiyle karşı karşıya
  • Modellere yaklaşım

    • Robotlara görme, akıl yürütme ve hareket yetenekleri kazandırır; her model başka modellerin üzerine inşa edilir
    • Katı programlama yerine yeni görevlere uyum sağlamalarını mümkün kılar
    • Üç alt pazardan oluşur:
      • Vision-language model (VLM) geliştiricileri: görsel anlayış ile doğal dili birleştiren çok modlu modeller; robotların algı katmanı olarak işlev görür
      • Vision-language-action (VLA) model geliştiricileri: VLM'ler üzerine kurulan, görsel algı, dil anlama ve motor kontrolünü birleştirerek komutları doğrudan fiziksel eyleme dönüştüren yapay zeka sistemleri
      • World model AI geliştiricileri: mekânsal ilişkileri, fizik kurallarını ve nedenselliği tahmin etmek için çevredeki değişimleri simüle eden modeller
    • Physical AI, robotiği sabit kodlanmış programlamadan esnek ve göreve uyarlanabilir sistemlere dönüştürüyor; VLA modelleri de önde gelen mimari olarak yükseliyor
      • Figure, 1X, Galbot gibi önde gelen insansı robot şirketleri özel VLA modelleri geliştiriyor
      • Nvidia ve Meta gibi büyük teknoloji şirketleri, robot üreticilerine ticari lisanslama için modeller geliştiriyor
    • World model'ler, öngörüsel akıl yürütme ekleyerek asıl kırılma noktası olabilir
      • World Labs ve Runway gibi şirketler world model'ler geliştiriyor
      • VLA'ler anlık girdilere tepki verirken, world model'ler çevrenin zaman içindeki değişimini simüle eder
      • Böylece robotlar sonuçları tahmin edebilir, çok adımlı eylemler planlayabilir ve hatalardan toparlanabilir
  • Foundation model'ler

    • Veri ve mimariyi birleştirerek algılama, akıl yürütme ve eylem kapasitesine sahip önceden eğitilmiş robot zekâsı sunar
    • Bazıları manipülasyon için genel amaçlıdır, bazıları ise özelleşmiştir
    • Geliştiriciler bu zekâyı sıfırdan kurmak yerine lisanslayıp uygulayabilir
    • Üç alt pazardan oluşur:
      • Robot foundation model geliştiricileri: farklı donanımlar üzerinde robotların görmesine, düşünmesine ve hareket etmesine yardımcı olan genel amaçlı modeller
      • Otonom sürüş foundation model geliştiricileri: büyük sürüş veri setleriyle eğitilen; algılama, tahmin, planlama ve kontrolü birleştirerek robotaksi, kamyon taşımacılığı ve teslimat için mevcut otonom sistemlerin yerini alan modeller
      • Çoklu robot iş birliği model geliştiricileri: görev dağıtımı, çarpışmadan kaçınma ve dağıtık karar almayı ele alarak robot sürülerinin birlikte çalışmasını sağlayan çok etmenli algoritmalar
    • Foundation model pazarı son derece dinamik
      • ABD'li teknoloji devleri (Microsoft, Google, Amazon) ile Çinli liderler (Huawei, Baidu), DeepSeek ve Physical Intelligence gibi dikkat çeken girişimlerle rekabet ediyor
    • Birçok şirket birden fazla foundation model türü üzerinde çalışıyor
      • Bir alandaki eğitim verisi, başka bir alandaki model performansını artırmaya katkı sağlayabilir
      • Nvidia, üç foundation model kategorisinin tamamında aktif olan tek şirket olarak tüm physical AI yığınının altyapısı konumuna yerleşiyor
    • Çoklu robot iş birliği bir sonraki frontier
      • Depoda insansı robotların, otonom mobil robotların ve otonom forkliftlerin birlikte çalıştığı senaryolar gibi
      • Farklı robot türleri arasındaki iş birliği için, merkezi kontrol olmadan görevleri, kaynakları ve çarpışmadan kaçınmayı yöneten bir orkestrasyon katmanı gerekiyor
      • Bunu yalnızca birkaç girişim (Field AI, Intrinsic) ve bazı büyük teknoloji şirketleri takip ediyor
      • Çalışmaların çoğu ticari dağıtımdan ziyade araştırma aşamasında kalıyor
    • Özel modellere sahip şirketler, farklılaşma ve dikey entegrasyon yoluyla daha yüksek marj elde edebilir
    • Üçüncü taraf yapay zekâyı lisanslayan şirketler, modelin metalaşmasıyla düşen maliyetlerden yararlanabilir; ancak temel teknoloji yerine dağıtım hızı ve entegrasyon kalitesiyle rekabet eder
  • Gözlemlenebilirlik (Observability)

    • Robotların üretim ortamında çalışırken neler yaşadığını yakalayarak laboratuvar geliştirmesi ile gerçek dağıtım arasındaki boşluğu kapatır
    • Robotik gözlemlenebilirlik platformları: geliştirme ve üretim süreçlerinde robotları izlemek, hata ayıklamak ve optimize etmek için kullanılan platformlar
    • Robotlar arızalandığında veya beklenmedik şekilde davrandığında, mühendisler olayı yeniden oynatıp kök nedeni belirleyebilir ve düzeltmeleri yayına alabilir
    • Gerçek edge case'ler simülasyon ve eğitime geri beslenerek modellerin iyileştirilmesini ve performansın artmasını sağlar
    • Foxglove ve Formant bunun öne çıkan örnekleri; performansı izler, hataları analiz eder ve dağıtım içgörülerini eğitim veri setlerine, simülasyona ve modellere geri besler
    • Güçlü gözlemlenebilirliğe sahip şirketler, hatalardan öğrenerek modellerini hızla iyileştirebilir
    • Beklenmeyen durumlar, üretime hazır sistemleri laboratuvar prototiplerinden ayıran temel unsur olarak bir öğrenme avantajına dönüşür

Henüz yorum yok.

Henüz yorum yok.