- Yalnızca metin promptlarıyla gerçek zamanlı etkileşimli 3D ortamlar üreten ilk genel amaçlı dünya modeli
- 24fps, 720p çözünürlük ve birkaç dakika boyunca tutarlılığı koruma sunuyor; önceki Genie 2'ye kıyasla etkileşim, gerçekçilik ve süreklilik büyük ölçüde iyileştirildi
- Fiziksel olaylar, ekosistemler, animasyonlar, tarihsel ve coğrafi arka planlar dahil çok çeşitli konularda sanal dünyaları doğal ve zengin biçimde üretebiliyor
- Promptable world events özelliği sayesinde kullanıcılar hava durumu değişimi, nesne ekleme gibi dinamik olayları metinle gerçek zamanlı kontrol edebiliyor
- Ajan araştırmaları için tasarlandı; SIMA ajanı gibi sistemlerle bağlantı kurarak uzun vadeli hedeflere ulaşma veya karmaşık davranış dizilerini test etmeyi mümkün kılıyor
Genie 3: dünya simülasyonunda yeni bir atılım
Dünya modellerinin gelişim arka planı
- DeepMind, AI ajan eğitimi, açık uçlu öğrenme ve robotik gibi alanlarda simülasyon ortamı araştırmalarına öncülük ediyor
- Dünya modeli, ortam değişimlerini ve ajan davranışlarının sonuçlarını öngörebilen ve yeniden üretebilen bir yapay zeka sistemi olup AGI'ye giden yolda önemli bir ara aşama olarak görülüyor
- Genie 1 ve 2'nin ardından Genie 3, gerçek zamanlı etkileşim ile görsel ve fiziksel tutarlılığı aynı anda sunan ilk dünya modeli olarak öne çıkıyor
Genie 3'ün başlıca özellikleri
-
Doğa ve fiziksel olay modelleme
- Su, ışık ve çeşitli çevresel etkileşimler gibi gerçek dünyadaki doğal olayları yalnızca promptlarla doğal biçimde oluşturabiliyor
-
Karmaşık ekosistemler ve animasyonlar
- Hayvan davranışları, bitki büyümesi gibi ekosistem dinamiklerini ve hayal gücüne dayalı animasyon dünyalarını üretebiliyor
-
Tarihsel ve coğrafi arka planların oluşturulması
- Coğrafi ve dönemsel sınırları aşan çeşitli mekanları sanal ortamlar olarak gerçek zamanlı biçimde kurabiliyor
-
Gerçek zamanlı etkileşim ve kontrol
- Kullanıcı girdisine göre 24fps ve 720p'de anlık dünya değişimlerini görselleştiriyor
- Daha önce ziyaret edilen konum ve durumları hatırlayarak birkaç dakika boyunca fiziksel ve görsel tutarlılığı koruyor
-
Promptable World Events
- Metin promptlarıyla hava durumu değişimi, nesne veya karakter ekleme gibi çevresel değişim olaylarını gerçek zamanlı tetikleyebiliyor
- Keşif kontrolünün ötesinde "ya şöyle olsaydı" senaryoları veya gündelik olmayan durumlar üretme gibi geniş kullanım alanları sunuyor
-
Ajan araştırmaları ve deneyler
- SIMA gibi 3D ortamlara özel yapay zeka ajanları, Genie 3 içindeki dünyalarda karmaşık hedeflerin peşinden giderek uzun sekanslı görevleri yerine getirme yeteneklerini doğrulayabiliyor
- Ajanın hedefleri Genie 3 ile paylaşılmıyor; sonuçlar yalnızca davranış dizileri ve dünya simülasyonu üzerinden üretiliyor
Teknik zorluklar ve başarılar
- Kare bazında otoregresif üretim sürecinde kullanıcı girdileri ile geçmiş sekansların tamamının gerçek zamanlı yansıtılması gerektiğinden oldukça zorlayıcı bir teknik yapı gerekiyor
- NeRF, Gaussian Splatting gibi mevcut yaklaşımlardan farklı olarak Genie 3, açık bir 3D temsil olmadan tamamen üretim temelli çalışıyor ve bu sayede çok daha dinamik ve zengin ortamlar oluşturuyor
Sınırlamalar ve görevler
- Davranış aralığı sınırlı: Prompt tabanlı ortam değişiklikleri çeşitli olsa da doğrudan gerçekleştirilebilen eylemler hâlâ sınırlı
- Çoklu ajan etkileşimi: Birden fazla ajan arasındaki etkileşimlerin doğru biçimde simüle edilmesi hâlâ araştırma konusu
- Gerçek dünya konumlarını yeniden üretme sınırı: Gerçek coğrafi alanlar için kusursuz doğruluk sunmuyor
- Metin render etme sınırı: Yalnızca açıkça girildiğinde net metin gösterimi mümkün
- Etkileşim süresi sınırı: Şu anda yalnızca birkaç dakikalık sürekli etkileşimi destekliyor
Sorumluluk ve yayın kapsamı
- Genie 3'ün açık uçlu ve gerçek zamanlı üretim özellikleri yeni güvenlik ve etik sorunlarını beraberinde getirdiğinden Responsible Development & Innovation Team ile yakın iş birliği yürütülüyor
- İlk aşamada yalnızca sınırlı sayıdaki araştırmacı ve içerik üreticisine araştırma önizlemesi olarak sunulacak; geri bildirimlerle kapsamın kademeli olarak genişletilmesi ve risklere karşı önlemler geliştirilmesi planlanıyor
Gelecek ve kullanım beklentileri
- Genie 3, eğitim, öğretim, yapay zeka ajan eğitimi ve performans doğrulama gibi birçok alanda yeni olanaklar sunuyor
- AGI (genel yapay zeka) araştırmalarında kilit bir rol oynaması bekleniyor ve insanlığa faydalı olacak şekilde güvenli biçimde geliştirilmeye devam edilecek
Henüz yorum yok.