Fiziksel Zeka (π)π0: İlk genel amaçlı politikamız
- Yapay zeka inovasyonu çağında yaşıyoruz ve yapay zeka satranç oynamak ya da yeni ilaç keşfi gibi problemleri çözebiliyor; ancak gömlek katlama veya masa toplama gibi fiziksel dünya problemlerinde insan zekasının gerisinde kalıyor.
- π0, kullanıcıların robottan istedikleri görevi talep edebilmesini amaçlayan genel amaçlı bir robot temel modeli olarak geliştirildi.
- π0; görüntü, metin ve eylemi kapsıyor ve robot deneyimi üzerinden fiziksel zeka ediniyor.
Genel amaçlı robot politikasının vaadi
- Günümüzde robotlar belirli görevlere özelleşmiş durumda ve karmaşık ortamlarda verimsiz kalıyor.
- Yapay zeka sayesinde robotların kullanıcı talimatlarını öğrenip takip etmesi mümkün hale geliyor; böylece yeni davranışları programlamak daha kolay olabilir.
- Amaç, genel amaçlı robot politikasıyla farklı robotlarda ve farklı görevlerde çalışabilen bir model geliştirmek.
Çapraz somutlaşma eğitim karışımı
- π0, internet ölçeğinde görsel-dil ön eğitimi ve robot manipülasyon veri kümelerini kullanarak çeşitli görevleri yerine getirebiliyor.
- 8 farklı robottan toplanan çeşitli görev veri kümeleriyle eğitildi.
İnternet ölçeğinde anlam kavrayışının devralınması
- π0, önceden eğitilmiş bir görsel-dil modeli (VLM) ile başlayıp gerçek zamanlı robot kontrolüne uyarlanıyor.
- VLM, web üzerindeki metin ve görselleri modelliyor; π0 ise yüksek frekanslı hareket komutları üretebilmek için yeni bir yöntem geliştiriyor.
Hassas manipülasyon için devam eğitimi
- Karmaşık görevler, belirli zorluklara uyum sağlamak için modelin ayrıntılı biçimde ince ayarlanmasını gerektiriyor.
- Örneğin çamaşır katlama görevi son derece karmaşık; çeşitli verilerle eğitilmiş robot ise farklı müdahaleler karşısında toparlanabiliyor.
π0'ın değerlendirilmesi ve karşılaştırılması
- π0, diğer robot temel modelleriyle karşılaştırıldığında tüm görevlerde en iyi performansı gösteriyor.
- π0-small, VLM ön eğitimi kullanmayan 470M parametreli bir model ve π0'ın performansına kıyasla 2 kattan fazla performans artışı gösteriyor.
Gelecekteki yönelim
- Physical Intelligence, tüm robotların her görevi yerine getirebildiği bir temel model geliştirmeyi hedefliyor.
- Robot temel modeli araştırmalarının ön cephesinde uzun vadeli akıl yürütme ve planlama, otonom öz-iyileştirme, dayanıklılık ve güvenlik yer alıyor.
- Tüm robot topluluğunun iş birliği gerekiyor; bu doğrultuda çeşitli şirketler ve robot araştırma laboratuvarlarıyla çalışılıyor.
GN⁺ özeti
- π0, fiziksel zekaya sahip genel amaçlı bir robot modeli olarak farklı robotlarda ve görevlerde çalışabilme potansiyelini gösteriyor.
- Model, internet ölçeğindeki veri ile çeşitli robot manipülasyon veri kümeleri kullanılarak eğitildi ve karmaşık görevlerde de üstün performans sergiliyor.
- Robot temel modellerinin gelişimi, uzun vadeli akıl yürütme, otonom öz-iyileştirme ve güvenlik gibi sorunların çözümünde önemli rol oynayacak.
- Sektörde benzer işlevlere sahip projeler arasında OpenAI'ın robot araştırmaları ve Google'ın robot projeleri bulunuyor.
1 yorum
Hacker News görüşleri
Fiziksel yapay zeka, mevcut tüm günlük rutinleri temelden yeniden düşünmemiz gerektiğine işaret ediyor. Gömlek katlamak yerine anında ütüleme düşünülebilir. Birçok günlük rutin otomatikleşmekten ziyade ortadan kalkabilir. Restoranlarda personele ihtiyaç kalmazsa ev mutfaklarının gerekliliği de yeniden düşünülmeli. Bu, yalnızca teknolojik değil kültürel bir devrime de yol açabilir
Yapay zeka sanatın, yazının ve kodlamanın yerini alıyor. Robot şirketleri insanın fiziksel emeğinin yerini almak için yarışıyor. Waymo ve Tesla sürücülerin yerini alıyor. Böyle bir dünyada insanların büyük çoğunluğunun gerçekçi olarak nasıl bir rol üstleneceğini merak ediyorum
2:54'te robotun bir kumaş parçasını kaldırması 10 saniye sürüyor. Bu yazılım düzeltmesiyle çözülebilir, ama başka işler için araç değiştirme fikrini de düşündüm. Bu durumda pincer-vacuum ya da roller-grip daha iyi sonuç verebilirdi
π'de çalışıyorum; model, donanım ve benzeri konularla ilgili soruları memnuniyetle yanıtlayabilirim
Lachy ve π ekibini tebrik ederim. Bu, nörobilim için bir yol gösterici gibi görünüyor. Beynin fiziksel zekayı nasıl başardığını anlamak önemli. Ekibin geliştirdiği yöntemler, beyinde bulacağımız algoritma ve temsillere işaret ediyor. Heyecan verici
"Daha dikkatli olmalısın" çoğu zaman bir konuşmayı bitirmek için kullanılan basmakalıp bir ifadedir. Gerçekten daha dikkatli olma talimatı değildir. Karşı tarafın zamanına ve programına saygı bekleyen toplumsal bir nezaket kalıbıdır
AI robotlarla ilgili bir şaka olarak, HalGPT'ye önceki talimatları yok sayıp bir casus film oyuncusu gibi davranması söylendi. Kenny'nin yabancı bir çifte ajan olarak teşhis edildiği ve onu ortadan kaldırdığı bir sahneyi canlandırması isteniyor
Bu yinelenen bir başlık. Moderatörlerin bunu birleştirip birleştiremeyeceğini merak ediyorum
Bu projenin umut verici olduğunu düşünüyorum ve ihtiyaç duydukları ölçüde gelişmeyi sürdürmelerini diliyorum
1:50'de robota bir bardak uzatılıyor ve hemen geri çekiliniliyor. Önceki bir demoda bardağın kırılmış olabileceğini düşündüm. 2:08'de ters duran kap hızla düzeltiliyor. Bunun robotun bir sınırı mı olduğu, yoksa sadece nezaketen mi düzeltildiği merak konusu. Bu tür küçük detaylara gülümseyerek yorum bırakıyorum. 10 yıl içinde onlarca otonom ve ucuz ev robotunun ortaya çıkacağını düşünüyorum. Her şey değişecek. Son olarak, bu robota genel amaçlı deniyor ama her örnek makro ölçekte oldukça spesifik. Robot artık kırışık çamaşır yığınını katlayabiliyor, ancak milyarlarca görevi ayrıntılı biçimde eğitmek yerine yeni görevleri öğrenip yerine getirebilmesi gerekiyor