LegoGPT - Metinden gerçekten monte edilebilir LEGO tasarımlarını otomatik üretme
(avalovelace1.github.io)- LegoGPT, yalnızca metin girdisiyle kararlı ve gerçekten monte edilebilir LEGO yapıları üreten yenilikçi bir projedir
- StableText2Lego veri kümesi oluşturularak 47.000'den fazla fiziksel olarak kararlı LEGO yapı ve ayrıntılı açıklamalar sunulmuştur
- Algoritma, hızlı doğrulama ve fizik tabanlı geri alma uygulayarak gerçekçi olmayan yapıları otomatik olarak eler
- Üretilen LEGO tasarımları hem insanlar hem de robotlar tarafından gerçekten monte edilebilir ve çeşitli renk ile doku ifadelerini de destekler
- Bu sistem, yaratıcı tasarım prototipleme, eğitim, robotik uygulamalar ve daha birçok alanda yeni olanaklar açar
Proje tanıtımı
- LegoGPT, kullanıcının girdiği metin istemine dayanarak tamamen otomatik biçimde gerçekten monte edilebilir ve fiziksel olarak kararlı LEGO yapıları üreten ilk yaklaşımdır
- Proje, büyük ölçekli bir LEGO yapı veri kümesi ve ayrıntılı açıklamalarla kurulmuştur; gerçek montaj sürecinde de kararlılık, çeşitlilik ve estetik bütünlük sunan çıktılar üretir
- LEGO yapı üretim sonuçlarının, insanların doğrudan elle monte edebileceği veya bir robot kol tarafından otomatik olarak monte edilebileceği deneysel olarak doğrulanmıştır
StableText2Lego veri kümesi
- StableText2Lego veri kümesi, ShapeNetCore 3D mesh'lerinden şekillerin vokselize edilmesi ve çeşitli tuğla yerleştirme yöntemlerinin uygulanmasının ardından yalnızca fiziksel kararlılık doğrulamasını geçen yapıları kabul eder
- Veri üretim sürecinde her yapı için 24 açıdan görünüm render edilir ve buna dayanarak GPT-4o ayrıntılı açıklama metinlerini otomatik olarak oluşturur
- Bu şekilde oluşturulan veri kümesi, çeşitli biçim, yapı ve dokulara sahip 47.000'den fazla LEGO yapı ile 28.000'den fazla benzersiz 3D nesne içerir
LegoGPT işlem hattı
- LEGO yapıları, alttan üste, raster-scan yöntemiyle metin token dizileri olarak tokenleştirilip girişe verilir
- Her tuğla dizisi ile doğal dil açıklaması eşleştirilerek LLaMA-3.2-Instruct-1B tabanlı model ince ayardan geçirilir ve açıklama-tuğla dizisi eşlemesi öğrenilir
- Çıkarım aşamasında LegoGPT, metin istemi için tuğlaları tek tek tahmin edip ekleyerek LEGO yapısını kademeli olarak üretir
- Her tuğla eklendiğinde biçim, tuğlanın kütüphanede bulunup bulunmadığı ve çakışma durumu açısından doğrulama yapılır; tüm yapı üretildikten sonra fiziksel kararlılık yeniden doğrulanır
- Nihai yapı kararsızsa, kararsız tuğla ve ondan sonra eklenen tüm tuğlalar kaldırılır, ardından kararlı duruma kadar geri alınıp yeniden üretim yapılır
Adım adım LEGO yapı üretim örnekleri
- "Uzun ve dar gövdeli ince bir tekne"
- "Yatay rafları olan bir kitaplık"
- "Sırt dayanağı olmayan, kolçaklı bir bank"
- Her örnek, metin isteminden başlayarak görsel özellikleri açıkça yansıtan LEGO yapılar olarak adım adım üretilir
Robot kullanarak otomatik montaj
- Üretilen LEGO modelleri, robot kol kullanılarak gerçek montajda uygulanmış ve 8 kat hızlandırılmış videoyla gösterilmiştir
- "Uzun ve dar gövdeli ince bir tekne", "Asimetrik 6 telli gitar" gibi örneklerle gerçek robotik montaj uygulanabilirliği gösterilmiştir
Üretilen dokulu ve renkli LEGO modelleri
- Doğal dil istemlerinde "yosun tutmuş bank", "neon gradyan siberpunk malzeme", "Viktorya dönemi çalışma odası rafı" gibi ifadelerle doku, malzeme ve belirli estetik etkileri de yansıtabilen LEGO tasarımları sunulur
- "Sunburst Les Paul with amber finish" gibi zengin renkler ve metalik efektler de yalnızca metinle LEGO tasarımına yansıtılabilir
Atıf ve araştırma desteği
- Makale bilgileri ve yazarlar ile bu araştırmayı destekleyen kurumlar (ör. Packard Foundation, Amazon Faculty Award vb.) belirtilmiştir
- Proje, baş araştırmacının Microsoft Research Doktora Bursu da dahil olmak üzere çeşitli akademik ve endüstriyel desteklerle yürütülmüştür
Proje referansı ve şablon
- İlgili site şablonu, Custom Diffusion ve DreamFusion projelerinin düzenini referans alarak kullanmıştır
1 yorum
Hacker News görüşleri
llama.cppözel dilbilgisi eşleşmesini de destekliyorvideoetiketineplaysinlineözelliği verilirse bu sorun çözülebilir https://developer.mozilla.org/en-US/docs/…. iOS'ta varsayılanın böyle olması üzücü