-
PabloNet
-
İnternete bağlı yapay zekanın yaratıcı olup olamayacağına dair tartışmanın asıl meseleden uzak olduğunu düşünüyorum. Sanat, iç dünyayı ortaya koymaktır ve teknoloji bunun yalnızca bir parçasıdır. Sanatın teknolojiye bu kadar bağımlı hale gelmesi üzücü. Bu iki unsuru ayırmanın mümkün olabileceğini görüyorum. 8 milyar sanatçı olmayan insanın kullanacağı ucuz, enterpolatif yaratıcılık yeni dünya görüşlerini ortaya çıkarabilir.
-
Bu nedenle, sanatsal yeteneği olmayan biri olarak çeşitli yapay zeka tabanlı sanat biçimlerine büyük ilgi duyuyorum. Birkaç aydır StreamDiffusion kullanarak web kamerası akışını gerçek zamanlı olarak difüze etme üzerine çalışıyorum. Amacım güzel görsel efektler üretmek ve yeni duygular uyandırmak. Ancak dizüstü bilgisayar formu bu illüzyonu bozuyor. Bu yüzden yakın zamanda duvara asılabilecek bir LCD çerçeve yaptım; böylece illüzyonu bozan unsurlar en aza indi. Bu kurulumun en büyük avantajı, bunun yalnızca sıradan bir ekran değil, kalıcı bir nesne olarak yeni bir etkileşim kanalı açması.
-
Mevcut kurulumun başlıca sorunu düşük kare hızı. TensorRT kullandım ve görüntü sıkıştırmayla hızı artırdım, ancak hâlâ geliştirilecek çok yer var.
-
İlgilenenler için nasıl yapıldığını ve nasıl katkı verilebileceğini paylaşıyorum:
- İstemci ve sunucu kodu sağlanıyor
- Sunucu barındırma için RunPod kullanılıyor
- İstemci Raspberry Pi 5 üzerinde çalışıyor
- 10.1 inçlik Pi ekranı kullanılıyor
- Kızılötesi aydınlatma kullanılıyor
- Sıradan bir çerçeve kullanılıyor
- Kızılötesi Pi kamerası kullanılıyor
- Kamera için delik açmak üzere delgeç kullanılıyor (
drillişe yaramıyor) - Çeşitli ön işleme filtreleriyle deney yapılıyor; yalnızca basit bir prompt yeterli değil. img2img, ön işleme olmadan fazla gerçekçi görünüyor. Bu yazıda görülen mavi Picasso tarzını elde etmek için Canny kenar algılama, mavi tonlama ve bulanıklaştırma birlikte kullanıldı.
GN⁺ Özeti
- Yapay zeka tabanlı sanat, teknoloji ile yaratıcılığı ayırarak yeni bakış açıları sunma potansiyeli gösteriyor.
- StreamDiffusion ile gerçek zamanlı web kamerası akışının difüzyona sokulması, yeni duygular ve görsel deneyimler sunuyor.
- LCD çerçeve kullanan bu yerleştirme, sıradan bir ekranın ötesine geçerek kalıcı bir sanat eseri olma ihtimalini ortaya koyuyor.
- Düşük kare hızı gibi teknik sorunlarda hâlâ iyileştirme alanı bulunuyor.
- Benzer işlevlere sahip projeler olarak DeepArt.io ve RunwayML öneriliyor.
1 yorum
Hacker News yorumları
JPEG baytlarını Base64 ile kodlamak, payload boyutunu yaklaşık %30 artırır ve hem istemci hem de sunucuda CPU döngüleri tüketir. WebSocket protokolü ikili payload aktarabildiği için metne dönüştürmeye gerek yok
Sanat, iç dünyayı açığa çıkarmaktır; teknik bunun yalnızca bir parçasıdır. Teknik açığın sadece bir rahatsızlıktan ibaret olduğu fikrini sorguluyorum
Sanatsal değeri hakkında konuşmayacağım, ama bir araç meraklısı olarak burada ilgimi çeken bir kısım var
Kameranın çerçevenin içinde değil de başka bir yerde olması daha havalı olurdu diye düşünüyorum. Sanatsal bir aynaya bakmak biraz sıkıcı
Sanatın duyguyu korumak ve yaratmak olduğunu hep düşünmüşümdür. Duvardaki muz da sanattır, pop müzik de hâlâ sanattır
Görüntüler arasındaki yüksek kare hızlı morphing efektini hiç düşünüp düşünmediğini soruyor. Bu, efektif kare hızını artırır ve hoş görünür
Mevcut kurulumdaki temel sorun düşük kare hızı. Bunu bir özellik olarak görüyor; görüntüyü işlemek için zaman olması kötü değil
En çok güç tüketen ayna ödülünü veriyor. Girdideki küçük değişikliklere karşı çizimin kararlı olmadığını fark etmiş
Bazı görüntüleri sabitlemenin bir yolu olup olmadığını soruyor. Bazı görseller korunursa güzel olacağını düşünüyor (ör. profil fotoğrafı veya kilit ekranı görseli)