Cihazda çevrimdışı kullanılabilen Easy Stable Diffusion XL
(noiselith.com)Noiselith uygulamasına giriş
- Çevrimdışı görsel üretim aracı: Noiselith, bulut olmadan cihaz üzerinde özgürce görsel üretmenizi sağlar.
- Gizlilik koruması: Tüm üretim işlemleri yerelde gerçekleşir ve hiçbir bilgi buluta gönderilmez.
- Sınırsız üretim: Günde 100, 200 hatta 1000 görsel üretebileceğiniz sınırsız üretim özelliği sunar.
- Hız: Sunucu kaynaklarını beklemeye gerek kalmadan cihaz üzerinde anında görsel üretimi yapılabilir.
Sistem gereksinimleri
- Windows: Windows 10 veya 11, NVIDIA RTX 20 serisi veya üzeri GPU (8GB ve üzeri VRAM), 16GB ve üzeri RAM, 20GB ve üzeri depolama alanı gerekir.
- macOS: macOS 12.3 veya üzeri, Apple Silicon, 32GB ve üzeri RAM, 20GB ve üzeri depolama alanı gerekir.
Kullanıcı deneyimi
- Kolay kurulum: Noiselith yalnızca birkaç tıklamayla kullanıma hazır hale gelir.
- Sezgisel kullanım: Teknik ayrıntılarla uğraşmadan fikirlerinizi görsele dönüştürmenizi sağlayan sezgisel bir arayüz sunar.
- Model yönetimi: Modelleri kolayca indirebilir, silebilir ve güncelleyebilirsiniz; ayrıca üretilen görselleri şık şekilde düzenleyen bir galeri sunar.
Geliştirme yol haritası
- Çeşitli özellik desteği: SDXL modelleri, SDXL LoRA, geçmiş yönetimi, proje yönetimi ve model yönetimi gibi özellikler planlanıyor.
- Topluluk ve genişletilebilirlik: Kullanıcı topluluğu, SD 1.5 ve 2.1 model desteği, model veritabanı, upscaler ve akıllı prompt gibi özellikler yer alıyor.
- Noiselith uygulama mağazası: Bulut GPU ve uzaktan iş birliği özelliklerini içeren bir uygulama mağazası geliştirilmesi planlanıyor.
GN⁺ görüşü
- Bu yazıdaki en önemli nokta, Noiselith uygulamasının kullanıcının cihazında, bulut desteği olmadan, gizliliği koruyarak sınırsız görsel üretebilen yeni bir araç olmasıdır.
- Bu uygulama, yazılım kurulum ve kullanımındaki karmaşıklığı azaltması ve sezgisel arayüzü sayesinde herkesin kolayca görsel üretmeye başlayabilmesini sağlamasıyla, yaratıcı çalışmalara daha fazla odaklanmayı mümkün kıldığı için ilgi çekicidir.
1 yorum
Hacker News yorumları
Az önce kurup denedim; oldukça hoş. Yerel yapay zeka benim istediğim gelecek ve ben de o yönde çalışıyorum.
Artıları: oldukça bağımsız çalışıyor; yerleşik model kurucusu iyi yapılmış, CivitAI’dan herhangi bir şeyi indirmeyi kolaylaştırıyor (https://civitai.com/models/183354/sdxl-ms-paint-portraits kurup denedim); görüntü üretim kalitesi yüksek ve stabil; üretimin ara aşamalarını gösteriyor.
Eksileri: 6.94GB SDXL model dosyasını sormadan, konumunu ya da boyutunu göstermeden bir yerlere indiriyor; sonradan ayarlardan konumu bulup değiştirebildiğimi öğrendim. İlk üretim, model yükleme yüzünden çok yavaş; üretim süresi kaydedilmiyor ama 64GB’lık M1 Max MacBook’ta birkaç dakika sürüyor gibi.
Birden fazla geri bildirim modülü var; sol alttaki sohbet çok rahatsız edici ve asla kullanacağımı sanmıyorum, sağ üstte de beta geri bildirim isteği var. Rakiplerinin aksine açık kaynak değil; 7 süreç çalışıyor ve boşta yaklaşık 1GB RAM kullanıyor. macOS’a özgü yerel bir UX değil; beklenen kısayollar veya yardım menüsü eksik, Electron uygulaması gibi. Genel olarak 4/5 veririm ve tekrar açıp bakmaya niyetliyim.
Yani evet. Bir Electron uygulaması ve Svelte, headless-ui, tailwindcss vb. kullanıyor.
Yerel çıkarım seçenekleri zaten epey fazla; önemli olan, açık kaynak olmaları ve özelliklerinin de daha sağlam olması.
Burada “Ama Auto1111 ya da Comfy’nin arayüzü kullanıcı dostu değil ki” diye savunma yapılacak olsa bile, o da zaten çözülmüş durumda: https://github.com/invoke-ai/InvokeAI
Panolarla düzenlemek de mümkün; panolar, görseller ve meta verilerin tamamı iyi tasarlanmış bir SQLite veritabanında saklanıyor ve DataGrip ile erişilebiliyor.
Henüz denememiş olanlara Fooocus’u şiddetle öneririm: https://github.com/lllyasviel/Fooocus
Yerel Stable Diffusion pipeline’ları inanılmaz derecede çok, ama bu araç kısa prompt’larla bile varsayılan çıktı kalitesinde ezici derecede iyi. Gerçekten etkileyici.
Bunun nedeni, diğer arayüzlerin uygulamadığı ya da varsayılan olarak açmadığı çok sayıda SDXL güçlendirme özelliğini bir araya getirmesi. Stable Diffusion 1.5’ten beri kullanıyorum ve bu alanı epey takip ettim; ComfyUI bir yana, diffusers üzerinde eşdeğer bir pipeline kurmak bile eziyet olurdu gibi geliyor. SDXL için “hit’ler derlemesi ve en iyi varsayılanlar” gibi hissettiriyor.
Ancak yan yorumda söylendiği gibi GTM’i paketlemiş olmaları hoş görünmüyor.
Örnekler:
https://imgz.org/i9oicVqo/
https://imgz.org/i8Ur3WjW/
https://imgz.org/i5j6r6TZ/
Umarım sektörümüzün tamamı bu tür gözetimi çalıştırmanın kötü bir tercih olduğunu fark eder ve sadece durur.
İlginç. Son birkaç aydır eğlencesine kullandığım https://diffusionbee.com ile karşılaştırmayı düşünüyorum.
Pazarlama açısından iyi olabilir ama cihaz üzerinde çalışma ve çevrimdışı kullanımı ana farklılaştırıcı olarak öne çıkarmak tuhaf. Çünkü çoğu kişinin Stable Diffusion’ı zaten bu şekilde kullanıyor olma ihtimali yüksek
Kurulumun ve kullanımın kolay olmasına daha çok odaklanmak daha iyi olur gibi. Bu hâlâ pek iyi çözülemeyen bir alan. Benim ölçütüme göre ControlNet, upscaling, yüz detaylandırıcı türleri ve mümkünse bölgesel prompting yoksa kullanmam
Ayrıca kendi SD üreticisini yapmak isteyen insanların, hâlihazırda var olan açık kaynak projelerinden birine katkı verse iyi olur diye de düşünüyorum
Uygulama mağazası iyi bir fikir olabilir ama Auto1111 ve sayısız eklentisinin olduğu bir dünyada Stable Diffusion topluluğunda pek iyi karşılanacağını sanmıyorum
Mevcut kullanıcılara cazip gelmese bile daha basit bir ürün yeni kullanıcılara fazlasıyla hitap edebilir
SD’yi ilk kurcaladığımda, birkaç dosyayı indirip çalıştırmak yerine ciddi şekilde eve telefon eden ya da VM gibi şeyler kullanan paketlerin çok olması bana tuhaf gelmişti
Satış amaçlı prompt “fantezi dünyası arka planının önünde baştan çıkarıcı bakışlarla, bacaklarını açarak oturan, beyaz gömlek ve kot hot pants giymiş, sarı kıvırcık saçlı genç bir kadın” mı gerçekten
Bunun gerçekten doğru olup olmadığını merak ediyorum
Kurulumdan sonra Windows makinede çalıştırmak için genel ve özel ağ erişimi izni vermem gerekti. “Çevrimdışı” deyip bunu istemesi biraz içime sinmedi
İlk çalıştırmada yaklaşık 30 GB veri indirdi. Sonraki çalıştırmalarda çevrimdışı çalışıp çalışmayacağını bilmiyorum. Benim durumumda ondan sonra sürekli çöktüğü için tekrar çalışmadı
Kaldırırken de tüm verileri geride bıraktı. Kullanıcı verisi değil; çalıştırılabilir dosyanın kendisi, Python sanal ortamı, güncelleyici ve tüm modeller kaldı. Kaldırma işlemi fiilen yalnızca Başlat menüsü kısayolunu silmekten ibaretti
Çalıştırmak için etkin bir internet bağlantısı gerekiyorsa “çevrimdışı” diye reklamını yapmak tamamen yanlış
Daha fazla yerel istemci çıkması kesinlikle sevindirici. Diğer yorumlarda belirtildiği gibi zaten harika olanlar da var. automatic1111’ı denedim; hızlı ve çok fazla ayar gerektirmiyor ama yine de çok sayıda düğme ve seçenek var, bu yüzden başta zorlayıcı geliyor. Fooocus çok hızlı ama doğal olarak özelleştirme daha az
Bir de ComfyUI var. Karmaşıklığın kutsal kâsesi gibi ama tam da bu karmaşıklık sayesinde gerçekten çok şey yapabiliyorsunuz. Düğüm tabanlı bir uygulama olduğu için özel iş akışları oluşturabiliyor, görüntü üretildikten sonra o “düğümü” başka bir yere gönderip upscaling gibi son işlemler yapabiliyorsunuz
Noiselith’in veya diğer araçların SDXLTurbo’yu destekleyip desteklemeyeceğini görmek istiyorum. Çıkalı yalnızca birkaç gün oldu ama bence oyunu tamamen değiştiren bir şey. Tüketici sınıfı GPU’da 512x512 bir görüntüyü yaklaşık 0,5 saniyede oluşturabiliyor. Kalitesi inanılmaz değil ama “ormandaki tilki” yazıp anında görmek, ardından “şapkalı”yı ekleyip yine anında üretmek çok değerli. Önceden tek bir görüntü için 12 saniye bekliyordum. Önemsiz gibi gelebilir ama bu kadar hızlı yineleme yapabilmek, yerel görüntü üretimini çok daha eğlenceli hâle getiriyor
Henüz test edemedim ama Comfy’de CoreML kullandığım için, daha kullanışlı bir frontend çıkarsa bu platformların backend optimizasyonu ve performans çalışmaları da daha fazla artar mı diye merak ediyorum
512 görüntülerde 1~4it/s çok hayal kırıklığı yaratıyor; 1024’te 2~3s/it de günümüz ölçütlerine göre çok yavaş. Üstelik ANE’nin bile MacBook Pro M3’te SD 1024x1024 görüntüyü çalıştıramaması üzücü