- Figure AI, genel amaçlı görevleri yerine getirebilen ve insanlardan doğrudan öğrenebilen 3. nesil insansı robotu Figure 03’ü duyurdu; hedefi ev kullanımı, ticari kullanım ve seri üretim
- Şirketin kendi geliştirdiği görsel-dil-eylem yapay zekası Helix için tasarlanan yeni nesil sensör sistemi ve el sistemiyle donatıldı; kare hızı 2 katına çıkarıldı, gecikme 1/4 oranında azaltıldı, görüş açısı %60 genişletildi ve böylece karmaşık ortamlarda hassas manipülasyon ve akıllı navigasyon sağlandı
- Ev ortamları için güvenliği artıran özellikler arasında çok katmanlı yoğunluk köpüğü ve yumuşak kumaş kaplama, yıkanabilir değiştirilebilir kıyafetler, kablosuz şarj, UN38.3 sertifikalı batarya ve geliştirilmiş gerçek zamanlı sesli konuşma ses sistemi yer alıyor
- Seri üretim için CNC işlemeden kalıp süreçlerine, yani basınçlı döküm, enjeksiyon ve damgalamaya geçilerek parça sayısı ve üretim maliyeti büyük ölçüde düşürüldü; şirketin kendi üretim tesisi BotQ yılda en fazla 12.000 adet üretebiliyor
- Parmak uçlarında 3 gramlık basınca kadar algılayabilen yüksek hassasiyetli dokunsal sensörler ve avuç içine gömülü kameralar sayesinde Helix, farklı şekil ve malzemelerdeki nesneleri kararlı biçimde kavrayabiliyor; 10Gbps mmWave veri aktarımıyla sürekli öğrenme mümkün hale gelerek gerçek genel amaçlı robotların temeli atılıyor
Figure 03
- Figure 03, Figure’un 3. nesil insansı robotu ve Helix, ev kullanımı ve küresel yayılım için tasarlanmış bir platform
- Amaç, insan benzeri görevleri yerine getiren ve insanlardan doğrudan öğrenen gerçek bir genel amaçlı robot oluşturmak
- Bunun için donanım ve yazılım tamamen yeniden tasarlandı; başlıca özellikler şöyle
- Helix: Figure 03, Helix’i (özel görsel-dil-eylem yapay zekası) desteklemek üzere özel olarak üretilmiş sensör sistemi ve el yapısı kullanıyor
- Ev: Hassas malzemeler, kablosuz şarj, geliştirilmiş ses sistemi ve batarya güvenliği iyileştirmeleri gibi eklemelerle güvenlik ve kullanım kolaylığı ciddi biçimde artırıldı
- Seri üretim: Yüksek katma değerli seri üretim düşünülerek tasarlandı ve buna uygun yeni bir tedarik zinciri ile üretim süreçleri kuruldu
- Küresel ölçeklenme: Düşük üretim maliyeti ve Helix etrafındaki teknolojik ilerlemeler, ticari uygulanabilirliği de önemli ölçüde yükseltiyor
Helix için tasarım
- Yapay zeka olmadan insansı robotların ölçeklenmesinin mümkün olmadığı değerlendirmesiyle Figure 03, Helix AI üzerinden gerçek dünyada akıl yürütmeyi gerçekleştirmeyi temel hedef olarak alacak şekilde tasarlandı
- Tamamen yeniden tasarlanmış sensör sistemi ve el sistemi, Helix’i çalıştırmak için özel olarak geliştirildi
- Yeni nesil görsel sistem, yüksek frekanslı visual-motor kontrolü destekliyor
- Yeni kamera mimarisi, daha kompakt bir form faktörde kare hızını 2 katına çıkarıyor, gecikmeyi 1/4’e indiriyor ve kamera başına görüş açısını %60 artırıyor
- Genişletilmiş alan derinliğiyle birleştiğinde Helix’e daha yoğun ve daha kararlı bir algı akışı sağlıyor
- Bu gelişmeler, ev gibi karmaşık ve kalabalık alanlarda akıllı navigasyon ve hassas manipülasyon için kritik önemde
- Her elde geniş görüş açılı ve düşük gecikmeli algılama sunan avuç içine gömülü kameralar yer alıyor
- Kavrama sırasında yedekli ve yakın mesafeli görsel geri bildirim sağlıyor
- Ana kameranın kapanması durumunda bile (dolap içi çalışma veya dar alanlar gibi) Helix görsel algısını koruyarak gerçek zamanlı uyarlanabilir kontrol sağlayabiliyor
- Figure 03’ün elleri, uyumluluk ve dokunsal tasarımda büyük bir sıçrama sunuyor
- Daha yumuşak ve daha uyumlu parmak uçları, yüzey temas alanını artırarak farklı şekil ve boyutlardaki nesnelerde daha kararlı kavrama sağlıyor
- Mevcut pazar seçenekleri incelendiğinde, güncel dokunsal sensörlerin gerçek dünya kullanımına dayanamayacak yapısal sınırlara sahip olduğu görüldü; bunun sonucunda şirket kendi 1. nesil dokunsal sensörünü şirket içinde geliştirdi
- Tasarım üç ilkeye dayanıyor: aşırı dayanıklılık, uzun vadeli güvenilirlik ve yüksek hassasiyetli algılama
- Her parmak ucu sensörü, 3 gram basınç kadar küçük kuvvetleri bile algılayabiliyor; bu, parmağın üzerine konulan bir ataşın ağırlığını hissedecek kadar hassas olduğu anlamına geliyor
- Bu hassasiyet sayesinde Helix, güvenli kavramayı kaymanın ilk işaretlerinden ayırabiliyor ve kırılgan, düzensiz ya da hareketli nesnelerde hassas kontrol sağlayabiliyor
- 10 Gbps mmWave veri aktarımı özelliğiyle tüm filo, sürekli öğrenme ve iyileştirme için terabaytlarca veriyi yükleyebiliyor
- Bu gelişmeler Figure 03’ü büyük ölçekli uçtan uca pixel-to-action öğrenimi için benzersiz biçimde uygun hale getiriyor
Ev için tasarım
- Ev içinde etkili çalışabilmesi için robotun günlük yaşam alanlarında insanlarla sorunsuz biçimde iş birliği yapması gerekiyor
- Bu düşünceyle Figure 03’e güvenlik odaklı çeşitli tasarım iyileştirmeleri eklendi
- Stratejik olarak yerleştirilmiş çok katmanlı yoğunluk köpüğü sıkışma noktalarını önlüyor; sert işlenmiş parçaların yerini yumuşak kumaş kaplama alıyor
- Figure 02’ye kıyasla kütle %9 azaltıldı, hacim önemli ölçüde küçültüldü ve böylece ev içinde hareket etmek daha kolay hale geldi
- Figure 03 bataryası, robot bataryası güvenliğinin sınırlarını genişletiyor
- Kötü kullanım veya arızaya karşı çok katmanlı koruma içeriyor (BMS, hücre, bağlantı, paket düzeyi güvenlik önlemleri)
- UN38.3 standart sertifikasını şimdiden almış durumda
- Güvenliğin yanı sıra Figure 03, günlük kullanım kolaylığı düşünülerek tasarlandı
- Yumuşak kumaş tamamen yıkanabiliyor; aletsiz şekilde çıkarılıp değiştirilebiliyor, böylece hızlı ve kolay değişim sağlanıyor
- Kesilmeye dayanıklı ve dayanıklı malzemelerden üretilmiş kıyafetler dahil çeşitli kıyafet seçenekleriyle özelleştirilebiliyor
- Robotla doğal iletişim kurmak için Figure 03, daha iyi gerçek zamanlı sesli konuşma sağlayan yükseltilmiş bir ses donanım sistemi kullanıyor
- Figure 02’ye kıyasla hoparlör boyutu 2 katına, çıkış gücü ise neredeyse 4 katına çıkarıldı
- Mikrofonlar daha iyi performans ve netlik için yeniden konumlandırıldı
- Tam otonom ve kablosuz bir sistem vizyonunu sürdüren Figure 03, kablosuz endüktif şarjı ve kablosuz veri aktarımını destekliyor
- Robot, ayağındaki şarj bobini sayesinde kablosuz standın üzerine sadece ayakta durarak 2kW ile şarj olabiliyor
- Böylece ev ortamında robot, gün boyunca ihtiyaç oldukça otomatik olarak dock’a gidip yeniden şarj olabiliyor
Seri üretim için tasarım
- İnsansı robotlar geleneksel olarak zaman alan ve yüksek maliyetli mühendislik prototipleri olarak tasarlanıyordu
- Figure 03, en başından seri üretim hedefiyle tasarlanan ilk robot
- Bu hedef üç ana girişimle gerçekleştirildi
- Tasarımın ve sürecin yeniden kurgulanması
- Tamamen yeni bir tedarik zinciri kurulması
- Yüksek kapasiteli üretim tesisi BotQ’nun geliştirilmesi
- Figure 02’den Figure 03’e geçerken, üretilebilirlik ve maliyet dikkate alınarak robotun neredeyse tüm bileşenleri yeniden tasarlandı
- Mekanik ve elektrik mühendisliği ekipleri, parça sayısını, montaj adımlarını ve tasarım gereksinimlerini karşılamak için zorunlu olmayan bileşenleri agresif biçimde azalttı
- Figure 02 ağırlıklı olarak CNC işleme için tasarlanmışken, Figure 03 büyük ölçüde basınçlı döküm, enjeksiyon kalıplama ve damgalama gibi kalıp süreçlerine dayanıyor
- Bu geçiş, kalıplar için ciddi bir ön yatırım gerektirdi ancak karşılığı açık oldu
- Her bir Figure 03 biriminin üretim maliyeti dramatik biçimde düştü; üretim hacmi arttıkça ölçek ekonomisi güçleniyor
- Figure 03’ü ölçeklemek için Figure’un, halen var olmayan bir endüstri için tamamen yeni bir tedarik zinciri kurması gerekti
- Aktüatörler, bataryalar, sensörler, yapısal parçalar ve elektronikler dahil birçok kritik modülde dikey entegrasyon tercih edildi (hepsi tamamen şirket içinde tasarlandı)
- Tekil bileşenler için ise gerekli hacmi, zaman çizelgesini ve ekibin talep ettiği sıkı kalite standartlarını karşılayabilecek tedarikçiler stratejik olarak belirlenip ortaklık kuruldu
- Bir yıla yayılan bu çalışmanın sonucu, Figure ile birlikte büyüyebilen ve agresif kapasite artışı planı altında binlerce, zamanla milyonlarca parça üretebilen küresel bir iş ortağı ağı oldu
- BotQ, robot üretimini ölçeklemek için tasarlanmış, Figure’a ait özel bir üretim tesisi
- BotQ’nun 1. nesil üretim hattı, başlangıçta yılda en fazla 12.000 insansı robot üretebiliyor
- Önümüzdeki 4 yıl içinde toplam 100.000 robot üretme hedefi var
- Figure, sözleşmeli üreticilere bağlı kalmak yerine kalite, tekrar edilebilirlik ve hız üzerinde sıkı kontrol sağlamak için en kritik sistemlerin üretimini şirket içine aldı
- Tesis, son teknoloji sistemler ve dijital entegrasyonla donatıldı; temelinde şirket içinde geliştirilen Manufacturing Execution System (MES) bulunuyor
- Tüm alt montajlar ve nihai montajlar, tam izlenebilirlik sağlayan bu hattan geçiyor; böylece kalite, tekrar edilebilirlik ve sürekli iyileştirme güvence altına alınıyor
Dünya ölçeği için tasarım
- Figure’un ev pazarına odaklanması, Figure 03’ün ticari pazardaki potansiyelini hiçbir şekilde sınırlamıyor
- Ev ortamlarının değişkenliğini ve zorluğunu çözerek Figure, iş gücünde mümkün olan en geniş görev yelpazesini yerine getirebilecek gerçek bir genel amaçlı ürün geliştiriyor
- Figure 03, çeşitli nedenlerle ticari uygulamalar için uygun
- Aktüatörler, iyileştirilmiş tork yoğunluğu (nm/kg) sayesinde 2 kat daha yüksek hızda çalışabiliyor
- Bunun en önemli sonucu, ürünleri daha yüksek hızda pick-and-place yapabilme yeteneği
- Helix için geliştirilen el ve sensör sistemindeki iyileştirmeler, ticari kullanım senaryoları açısından büyük önem taşıyor
- Kamera ve algı sistemi yükseltmeleri sayesinde Figure 03, ticari ortamları akıllı biçimde gezebiliyor ve hassas manipülasyon gerçekleştirebiliyor
- Yukarıda vurgulanan el değişiklikleri (uyumluluk artışı, parmak ucu yüzey alanı, dokunsal algılama), küçük sac metal parçaları ve şekil değiştirebilen polybag’ler gibi çeşitli nesnelerde daha iyi ve kararlı kavrama sağlıyor
- Endüktif şarj sayesinde Figure 03, kullanım senaryoları sırasında belirli aralıklarla sadece şarj matının üzerinde durarak neredeyse kesintisiz çalışabiliyor
- Hızlı kablosuz veri aktarımı da robotun vardiya molalarında yalnızca dock’a geri dönerek verileri sorunsuz aktarmasını sağlıyor
- Ticari müşteriler, Figure 03 filosu için kendilerine özgü üniformalar tasarlayabiliyor
- Daha dayanıklı ya da kesilmeye dirençli malzeme seçenekleri ve belirli ortamlar için başka tasarım değişiklikleri yapılabiliyor
- Figure 03’ün yeni yan ekranı, büyük filolarda hızlı tanımlamaya olanak tanıyor ve her müşterinin markalama ya da operasyonel gereksinimlerine göre tamamen özelleştirilebiliyor
Sonuç
- Figure 03, insansı robotları deneysel prototiplerden dağıtıma uygun ve ölçeklenebilir ürünlere dönüştürme yolunda benzeri görülmemiş bir ilerleme sunuyor
- Gelişmiş algı ve dokunsal zekayı, ev güvenliği odaklı tasarım ve seri üretim hazırlığıyla birleştirerek Figure, hem ev hem de ticari ortamlarda öğrenebilen, uyum sağlayabilen ve çalışabilen bir platform kuruyor
- Helix, ev ve dünya ölçeği için tasarlanan Figure 03, gerçek genel amaçlı robotun temelini oluşturuyor ve insanların yaşama ile çalışma biçimini değiştirme potansiyeli taşıyor
1 yorum
Hacker News görüşleri
Tüm video örneklerinin özenle seçilmiş sahneler olduğuna dikkat çekiliyor; gerçekten insansı robotlar üzerinde çalışanlara sorulursa, tekrar eden çalıştırmalarda başarısızlık oranının yüksek olduğu ve başarı yolunun çok dar olduğu söylenir. Birden fazla şirketin robotlarını çağırıp işlevlerini önceden doğruladıktan sonra, eğitim verilerinde olmayan bir ortam hazırlayıp kıyaslama yapılırsa gerçek başarısızlık oranı görülebilir. Şu an hâlâ sadece teknoloji demosu aşamasındayız. Eğitimin büyük kısmı fiziğin yaklaşıklandığı simülasyonlarda yapılıyor, geri kalanı ise insanların joystick ile doğrudan kontrol etmesiyle gerçekleşiyor. Elle yapılan tüm hareketler buna dahil ve başarısızlık oranı oldukça yüksek.
Son videoda gösterilen “paket yığınından kutu alıp etiketi aşağı bakacak şekilde konveyöre koyma” işi en gerçekçi olanı. Önceki modelin bunu 1 saat boyunca kesintisiz tekrarladığı videoyu Twitter’da(link) görmüştüm. İnsansı robotun şart olduğundan emin değilim ama çeşitli paketleri kavrayıp manipüle etmesi ve hatalardan toparlanabilmesi oldukça etkileyici.
Sorun da bu zaten. Eğer bu robot bunu gerçekten yapabiliyorsa, mağaza raflarına stok yerleştirme gibi net kullanım alanları var. Picking ve placement işleri koşulları sınırlı, insan benzeri hareket kabiliyeti gerektiren ve insansı formun uygun olduğu ortamlar. Ne kadar yaklaşıldığını merak ediyorum. Bu zaten 2020’de denenmişti(link), 2022’de de denenmişti(link); 7-11 Japan’da kullanılan paletli bir robot. Mağazada dolaşıp rafları görsel olarak inceleyen ve planogram ile karşılaştıran robotlar zaten epey yaygın kullanılıyor. Doğrudan ürünleri manipüle etmiyorlar. Stok işi planlamasına yardımcı sistemler de mevcut. Delft Teknik Üniversitesi araştırma ekibi bunun 5 yıl içinde mümkün olacağını iddia ediyor(link), ancak tam kaynak zamanı belli değil.
Söylemek istediğimi çok iyi özetlemiş. Gerçekten de tüm videolar pazarlama amaçlı. Logistics videosunu izlerken(link), bu modelin ev işlerini denediği sahneleri görmek istedim. Kesinlikle pürüzsüz olmayacak, bolca hata ve başarısızlık olacak. Bunu kötü anlamda söylemiyorum; tam tersine bunları olduğu gibi göstermeleri daha iyi olurdu. Bir sonraki video çıkarsa kesin izlemek isterim.
Hep böyleydi. Şirketin kuruluşunun üzerinden daha birkaç yıl bile geçmedi. Ben insansı robot kampının müridi değilim ama bir şey başlatmak için bir yerden başlamak gerekir. Ne yazık ki fon toplamak için her zaman “abartı > gerçek” düzeni ortaya çıkıyor; bu yüzden böyle özenle seçilmiş videolar görüyoruz.
Amazon’daki gerçek paket sınıflandırma işinin 1 saat boyunca yapıldığı videoyu izlemiştim(link); yukarıdaki iddiaları bununla nasıl bağdaştırmak gerektiğini merak ediyorum.
Buradaki yorumlar fazla olumsuz geliyor. 5 yıl önce bunların hiçbiri mümkün değildi. Şimdi ise yakında, birkaç tekrarın ardından ev işlerinin çoğunu sorunsuz yapabilecek tüketici robotu demoları bile çıkıyor. Kurbağanın bir anda kaynamaya başlaması gibi her şey çok hızlı değişiyor.
5 yıl önce mümkün olmadığı söylense de, Boston Dynamics 20 yıldır gerçek ürün demoları yayımlıyor (abartılı reklam değil). Ama bunların hiçbiri büyük pazarda fiili kullanım örneğine dönüşmedi. Heyecan duymak mümkün ama neden herkesin temkinli olduğunu da anlamak lazım.
Hedef gerçekleşmeden önce ne zaman ulaşılacağını kimse bilemez. Akıllı telefonlar gibi bir anda ölçeklenen örnekler var ama nükleer füzyon gibi onlarca yıl geçmesine rağmen kırılım yaratamayan alanlar da var. İnsansı robotlar ikincisine daha yakın olduğu için insanlar her yeni gelişmeye anında alkış tutmaz oldu. Sonradan bir atılım çıkarsa herkes onun “gerçek” olduğunu söyleyecek, ama o zamana kadar herkes şüphe duyar.
“Birkaç tekrarın ardından ev işlerinin çoğunu sorunsuz yapacak” deniyor ama beyaz yaka işler LLM’ler tarafından devralındığında bize yapmamız söylenen tesisatçılık işlerinin de sonunda yok olacağını düşünüyorum.
Tekrarlanabilir demolar veya hızlı evrimden söz ediliyor ama hâlâ ya çok pahalılar ya da gerçek ortamda kendi başlarına öğrenip iş yapamıyorlar. Bu N’inci gömlek katlayan robot videosu olabilir ama dağınık bir odadan veya çamaşır yığınından çamaşır alındığını hiç görmedim. İlk yapay zeka robotunun bir evcil hayvan olacağını tahmin etmiştim ama henüz Furby seviyesine bile gelinmiş gibi durmuyor.
Böyle robotlar tüm ev işlerini yapsa bile, mahremiyetimin üreticiye açılma ihtimali beni endişelendiriyor. Ring kameralarındaki güvenlik ihlalleri vakalarından(link) da görüldüğü gibi, hareket eden robotlarda mahremiyet ihlali seviyesi çok daha ciddi olur. Satın alacaksam güçlü mahremiyet güvenceleri isterim.
Kameralı Roomba modellerinde utandırıcı görüntülerin üreticiye gönderildiği ve çalışanların bu görüntüleri sosyal medyada paylaştığı durumlar da olmuştu. Yani bu zaten yaşandı. Evde dolaşan kameralı drone güvenlik sistemleri de vardı ama onlara ne olduğunu bilmiyorum. Çeşitli mahremiyet sızıntıları çıkmasından endişe etmiştim (link).
Figure 03’ün 10Gbps mmWave veri offloading ile tüm filonun sürekli öğrenme için terabaytlarca veri yükleyebilmesini sağladığı söyleniyor. Bunu görünce benim için anında hayır oldu.
Mahremiyeti bir kenara bıraksak bile, @elder_plinius gibi biri eve gelirse ne olacağını hayal ediyorum. Yapay zeka güvenliği, yapay zekanın bir bedene kavuştuğu anda çok daha somut bir meseleye dönüşüyor.
Benim için en korkutucu şey, uzaktan hacklenip ben uyurken robotun bana zarar verebileceği düşüncesi.
Aile üyeleri içeri girince robotun hemen odadan çıkması ve yalnızca her zaman boş olan odalarda temizlik yapacak şekilde programlanmasını isterdim.
İnsanlar fazlasıyla eleştirel. Bunun bu robotların şimdiye kadarki en kötü hâli olduğunu düşünmek gerek. Bir robot tek bir görevde geliştiğinde, tüm diğerleri bu öğrenimi paylaşabilir. Bundan sonra giderek daha iyi olacaklar.
Videonun manipüle edildiğini veya özenle seçildiğini bilsem de, bu ilerleme ürkütücü derecede etkileyici. İnsanların bu kadar olumsuz bakması bana daha da şaşırtıcı geliyor.
Teknolojik ilerlemenin kendisinden şüphe etmiyorum ama kişisel olarak teknolojik gelişmenin bir anda distopik bir hâl aldığını hissettiğim için artık olumlu olamıyorum. Muhtemelen olumsuz tepkilerin büyük kısmı da bundan kaynaklanıyor. Tabii bazıları yatırım balonundan endişe ediyor olabilir.
Neden şarj edilmesi gerektiğini anlamıyorum. Kapasitesi 1/3 olan üç batarya koyup her birini bağımsız şarj edilebilir yapsan, robot şarj istasyonuna gidip sadece bataryaları değiştirebilir. Neden ille de kablosuz şarj ya da kablo kullanılmak zorunda anlamıyorum. Batarya değişimi bana çok daha mantıklı geliyor. Batarya ömrü verilerine dayanarak robotun kendi kendine değişim ve geri dönüşümü bile yapması daha iyi olurdu. Şarj istasyonu güneş panellerinin altındaki açık bir alandaysa elektrik maliyeti de düşebilir. Şarj veya batarya değişimi sırasında kapıları da kendi kilitleyebilir, hava kötüleşirse tüm sistemi içeri alabilir.
Batarya ömrüne bağlı. Tüm gün kullanılabiliyorsa gece bir pad üzerinde bekleyip şarj olması mantıklı. Çıkarılabilir batarya eklemek ağırlığı artırır ve batarya konumlandırma özgürlüğünü azaltır. Şarj hızı da önemli; 30 dakikada %80 şarj oluyorsa ana işler arasında kısa kısa şarj olabilir. Ayakların altından endüktif şarj mümkünse, büyük bir şarj matının üstünde durarak fabrika ortamında neredeyse sınırsız çalışabilir. Çamaşır katlama ya da bulaşık yıkama 30 dakika sürüyorsa, o alana şarj matı konup çalışırken şarj olması sağlanabilir. Gelecekte yeni yapılan evlerde her kata gömülü şarj bobinleri bile olabilir.
Batarya değişimi ek hareketli parçalar ve özel bir gövde gerektirir; bataryaların da daha dayanıklı olması gerekir ve en az 2 tane gerekir. Kablo takma işi teoride robotun kendi başına yapabileceği bir şey gibi görünebilir ama pratikte ortam öngörülemez olduğu için kablo engel olabilir (gerçi endüktif şarj da engellenebilir...).
En olası sebep, önceden programlanmış senaryolarda bile belirli bir konumda batarya değiştirmenin hâlâ zor olması. Kendi kendine şarj kablosu takmak da mümkün değil. Buna rağmen çamaşır katladığını söyleyip gerçek olasılığı olduğundan büyük gösteriyorlar. Böyle bir duyuru görsem hisselerimi hemen satardım.
Batarya değiştiremeyip şarj istasyonuna da gidemiyorsa ne olacağını düşünmek lazım. Robot süpürgenin koltuğun altında kalması gibi, bu kez 150 cm / 300 kg’lık bir şeyi çekip çıkarman gerekebilir.
Walker S2, demoda batarya değişimini iyi yapıyor gibi görünüyor (link).
Bunu GPT-2’ye benzeten görüş bana ilginç geliyor. Dışarıdan hoş bir benzetme gibi ama özü tamamen farklı. GPT tarafında web belgeleri ve kitaplar gibi eğitim verileri zaten önceden vardı. Hesaplama kaynakları da mevcuttu. Sonuçta mevcut kaynakları bir araya getirip 2017 tarihli makale fikrini gerçeğe dönüştüren bir “kombinasyon oyunu”ydu ve bir kez deneyince işe yaradı. Öte yandan insansı robotlarda, sinir ağı eğitimi için gereken gerçek veri ölçek olarak neredeyse hiç yok ve verinin doğası da token tahmini kadar basit değil, çok daha karmaşık. Yine de Figure ekibinin meydan okuma ruhunu destekliyorum. Örneklerin özenle seçildiği açık ama bunlar ürün satmaktan çok Ar-Ge ve araştırmayı yatırımcılara göstermek için; sonuçta inovasyon açısından olumlu bir işlev görüyor.
Simüle edilmiş ortamda RL çalıştırılıp doğrulamayı görsel LLM’in yaptığı bir yapı (2D görüntüyle durum kontrolü, Vision-Language Model’in 0 ya da 1 döndürmesi) ile, Sora benzeri video genişletme modellerinin çamaşır makinesi-kurutucu işleri gibi alanlara FPV(First Person View) tabanlı tahmin yapısı olarak uygulanması fikri öneriliyor.
İçerikle doğrudan bağlantılı değil ama bakmaya değer ilgili araştırma bağlantılarını paylaşıyorlar
link1
link2
link3
link4
Bu, mevcut eğitim yöntemlerinin aynı şekilde süreceğini varsaymak değil mi? Doğrudan çevreden öğrenen yöntemlere ihtiyaç olacak gibi geliyor. Son araştırmalarda bu tür genel zeka yapılarının ortaya çıkmasına uygun mimariler de öneriliyor. Ama bu alanda henüz yeterli büyük yatırım veya ciddi deneme görmedim.
Videoda gösterilen kullanım senaryoları ilginç. Dünya insanlar için tasarlandığı için insan biçimli robotların uygun olduğunu düşünüyorum. Çamaşır makinesini ya da tüm evi robota göre yeniden düzenlemek gerekmemesi avantaj. Ama otel resepsiyonu gibi insani unsur gerektiren işlerde robot kullanmak saçma. Eğer insanın sunduğu faydayı (ruh hâli, yakınlık hissi) tamamen ortadan kaldıracaksan, o zaman kiosk çok daha iyi ve pratik.
İnsan dostuluğu ile verimlilik arasında hangisinin hedefleneceğini düşündüm. Birçok durumda verimliliği daha fazla önemseyen tarafı seçtik. Robotlar çeşitli işleri tamamen üstlenecek noktaya geldiğinde, insan öncelikli alanları korumak için sebep de kalmayabilir; bu durumda insansı formun avantajı da ortadan kalkar. Örneğin lojistik depoları bugün hâlâ insanlar yüzünden insan merkezli yapıda; tam otomasyon olursa bu ölçüt de kaybolur.
Birkaç yıl önce Las Vegas’a iş seyahatine gitmiştim ve otelde check-in/check-out işlemlerinin otomatikleşmiş olması etkileyiciydi. Kioska sadece kod ve pasaport gösterip istediğin seçenekleri işaretliyorsun, oda konumu gösteriliyor/yazdırılıyor, anahtar kartı da veriliyor. Hissiyat olarak 4 kişinin yaptığı işin %90’ından fazlasını 4 kiosk karşılayabiliyor gibiydi ve bekleme hissi de farklıydı. Yine de kiosklar da sık bozuluyor; havaalanlarında türlü arıza örnekleri görülüyor. Çamaşır makinesi konusu içinse çözüm ev otomasyonunda standardizasyonu ilerletmek. Thread gibi teknolojilerle bir “ev botu”nun durumu kendi gözleriyle kontrol etmesine gerek kalmadan, gerçek zamanlı bilgiyi doğrudan alabilmesi gerekir.
Uzun zamandır otel ve araç kiralama check-in süreçlerinin otomatikleştirilmesi gerektiğini savunuyordum. Kısa süre önce kiralık araçta gerçekten böyle bir sistem kullandım ama hiç pürüzsüz değildi. Sistem kodu tanımadı, birkaç kez personel yardımı gerekti, yanlış anahtar atandı. Sonunda ancak bir insan tekrar anahtar girince çözüldü. Fikir iyi ama uygulama zayıftı.
İronik biçimde yürüyen robotların en gerçekçi kullanım alanı “kendi başına hareket edebilen bilgisayar” olabilir. Hareketli sunucu, hoparlör veya veri toplama cihazı için bir alt gövde olarak kullanılıp sahada kendi kendine konumlanabilirse, beynin %15’ini angarya işlerden kurtaracak kadar faydalı olabilir. (Otel anahtar kartı konusuna dönersek, teknik olarak kart okuyucular kredi kartı okuyucusu işini de üstlenebilirdi. Operasyonel olarak ise personelin misafirin durumunu gözle doğrulaması gibi nedenlerle tam otomasyon her zaman kolay değil.)
Resepsiyondaki insani unsuru sevmeyen insanlar da var. Mümkünse sadece QR kod veya geçiş bilgisi alıp insan teması olmadan doğrudan odaya çıkabilmek için ekstra para bile öderdim.
Mühendisler, insanların neden verimsiz ama üst düzey araçları (insansı robotlar gibi) düşük seviyeli yüksek verimli araçlara tercih ettiğini anlamıyor gibi. Örneğin bulaşık makinesi almak; satın alma, kurulum, kullanım kılavuzunu öğrenme gibi süreçler gerektiriyor ama bir insana “tabakları yıka” demek çok daha sezgisel. Sonuç biraz eksik olsa bile, birçok kullanıcı bunun için gönüllü olarak daha fazla para öder. Verimlilik uğruna herkesin zaman ve emek harcamaması insan doğasının bir parçası.
Gerçek insan çalıştırmada da benzer durum var. Saatlik maliyet daha yüksek ve performans daha düşük olsa bile, çalışan istihdam ederken yaşanan çeşitli karmaşıklıklardan kaçınabiliyorsun. (Bunun iyi bir fikir olduğunu söylemiyorum, sadece maliyet açısından düşünüyorum.)
Yine de bunun sınırları açık. Örneğin bulaşık işi için zaten para verip en yüksek verimliliğe ve esnekliğe sahip bir ev yardımcısı tutabilirsin. Eğer birçok ev işini yapan otomat benzeri bir hizmetçi olsa, bunun gerçek satın alma değerinin $1k ile $100k arasında nerede oluşabileceği ve üstüne bakım maliyeti, güvenilirlik gibi değişkenler çok fazla. “Birçok insan tercih eder” dediğimiz grubun kapsamının ne kadar geniş olacağını gerçekten merak ediyorum.
Robotun tasarımı zor ama asıl zor olan “deployment”, yani sahaya gerçek yerleştirme. Kaç tane robotun nerede ve hangi işte kullanıldığı asıl mesele. Gerçekten yeterince işe yarayan görevler hangileri, her kurulum ortamına nasıl uyum sağlıyorlar, zamanla nasıl değişiyorlar; bunlara bakmak lazım. Genel amaçlı robot geliştirmenin en büyük zorluğu her zaman yapay zeka oldu. Eğer Figure gerçekten gelişmiş ve çok yönlü bir yapay zeka çıkarırsa, yani geniş yelpazede ortamlara hemen konuşlandırılıp çeşitli görevlerde doğrudan sonuç üretirse, bu olağanüstü bir ürün olur. Gerçek deployment sayısını takip edip küçük şirketlerde, karmaşık alanlarda (inşaat, bakım) gerçekten kullanılıp kullanılmadığına, Walmart kamyon boşaltma veya mağaza raf stoklama gibi işlerde rahatça çalışıp çalışmadığına bakarsak bunun gerçek olup olmadığını anlarız.
Bu tür robotlar 30 milyon won bandına gelirse her evde olacakları bir çağın geleceğini düşünüyorum. Nükleer füzyonla birlikte, ev tipi robotların bizim neslin simge teknolojilerinden biri olmasını bekliyorum. Uzun zamandır sadece hayal edilen bir şeydi ama artık benim yaşamım içinde ekonomik olarak gerçekçi hâle geleceğini düşünüyorum. Evde robot olması fikri bende korku, hayranlık ve tedirginliği yarı yarıya uyandırıyor.
Mahremiyet meselesi mutlaka çözülmeli. Teoride robot yalnızca evimin bodrumuna kurulu bir sunucuyla iletişim kurabilmeli.
Bu robotların hacklenip ağır suçlarda kullanılmasına dair haberler çıkmasını da bekliyorum.
Ev işlerinin ekonomik değeri düşük olduğu için yeterince ucuzlamadan kitlesel kabul görmesi zor. Bulaşık yıkamak ya da çamaşır makinesi çalıştırmak için 30 milyon won harcamayı düşünmem. Teknolojiye meraklı zenginler yenilik olsun diye alabilir ama kitle pazarı hâlâ fiyat/performansa bakar. Eskiden ucuz olduğu için robot süpürgeler çok satıyordu ama şimdi birçok evde neredeyse kullanılmadan duruyor. Robotların en güçlü kullanım alanı sanayi, üretim, inşaat ve tarım; bunun için de insansı form şart değil, hatta böyle bir görünüm sendikaların tepkisini artırabilir. Gerçekten “sadece bir araç” gibi görünen tasarımlar daha çok kabul görebilir.
Akıllı ev trendini zaten tamamen atladım, bunu da atlamayı düşünüyorum. Her zamanki gibi bulaşığı ve çamaşırı kendim yaparım.