2 puan yazan GN⁺ 2023-12-03 | 1 yorum | WhatsApp'ta paylaş

Noiselith uygulamasına giriş

  • Çevrimdışı görsel üretim aracı: Noiselith, bulut olmadan cihaz üzerinde özgürce görsel üretmenizi sağlar.
  • Gizlilik koruması: Tüm üretim işlemleri yerelde gerçekleşir ve hiçbir bilgi buluta gönderilmez.
  • Sınırsız üretim: Günde 100, 200 hatta 1000 görsel üretebileceğiniz sınırsız üretim özelliği sunar.
  • Hız: Sunucu kaynaklarını beklemeye gerek kalmadan cihaz üzerinde anında görsel üretimi yapılabilir.

Sistem gereksinimleri

  • Windows: Windows 10 veya 11, NVIDIA RTX 20 serisi veya üzeri GPU (8GB ve üzeri VRAM), 16GB ve üzeri RAM, 20GB ve üzeri depolama alanı gerekir.
  • macOS: macOS 12.3 veya üzeri, Apple Silicon, 32GB ve üzeri RAM, 20GB ve üzeri depolama alanı gerekir.

Kullanıcı deneyimi

  • Kolay kurulum: Noiselith yalnızca birkaç tıklamayla kullanıma hazır hale gelir.
  • Sezgisel kullanım: Teknik ayrıntılarla uğraşmadan fikirlerinizi görsele dönüştürmenizi sağlayan sezgisel bir arayüz sunar.
  • Model yönetimi: Modelleri kolayca indirebilir, silebilir ve güncelleyebilirsiniz; ayrıca üretilen görselleri şık şekilde düzenleyen bir galeri sunar.

Geliştirme yol haritası

  • Çeşitli özellik desteği: SDXL modelleri, SDXL LoRA, geçmiş yönetimi, proje yönetimi ve model yönetimi gibi özellikler planlanıyor.
  • Topluluk ve genişletilebilirlik: Kullanıcı topluluğu, SD 1.5 ve 2.1 model desteği, model veritabanı, upscaler ve akıllı prompt gibi özellikler yer alıyor.
  • Noiselith uygulama mağazası: Bulut GPU ve uzaktan iş birliği özelliklerini içeren bir uygulama mağazası geliştirilmesi planlanıyor.

GN⁺ görüşü

  • Bu yazıdaki en önemli nokta, Noiselith uygulamasının kullanıcının cihazında, bulut desteği olmadan, gizliliği koruyarak sınırsız görsel üretebilen yeni bir araç olmasıdır.
  • Bu uygulama, yazılım kurulum ve kullanımındaki karmaşıklığı azaltması ve sezgisel arayüzü sayesinde herkesin kolayca görsel üretmeye başlayabilmesini sağlamasıyla, yaratıcı çalışmalara daha fazla odaklanmayı mümkün kıldığı için ilgi çekicidir.

1 yorum

 
GN⁺ 2023-12-03
Hacker News yorumları
  • Az önce kurup denedim; oldukça hoş. Yerel yapay zeka benim istediğim gelecek ve ben de o yönde çalışıyorum.
    Artıları: oldukça bağımsız çalışıyor; yerleşik model kurucusu iyi yapılmış, CivitAI’dan herhangi bir şeyi indirmeyi kolaylaştırıyor (https://civitai.com/models/183354/sdxl-ms-paint-portraits kurup denedim); görüntü üretim kalitesi yüksek ve stabil; üretimin ara aşamalarını gösteriyor.
    Eksileri: 6.94GB SDXL model dosyasını sormadan, konumunu ya da boyutunu göstermeden bir yerlere indiriyor; sonradan ayarlardan konumu bulup değiştirebildiğimi öğrendim. İlk üretim, model yükleme yüzünden çok yavaş; üretim süresi kaydedilmiyor ama 64GB’lık M1 Max MacBook’ta birkaç dakika sürüyor gibi.
    Birden fazla geri bildirim modülü var; sol alttaki sohbet çok rahatsız edici ve asla kullanacağımı sanmıyorum, sağ üstte de beta geri bildirim isteği var. Rakiplerinin aksine açık kaynak değil; 7 süreç çalışıyor ve boşta yaklaşık 1GB RAM kullanıyor. macOS’a özgü yerel bir UX değil; beklenen kısayollar veya yardım menüsü eksik, Electron uygulaması gibi. Genel olarak 4/5 veririm ve tekrar açıp bakmaya niyetliyim.

    • macOS’ta Draw Things’e de göz atmaya değer. 8GiB macOS cihazlarda bile SDXL gayet iyi çalışıyor.
    • Teknoloji yığınını merak ediyorsanız burada: https://noiselith.notion.site/License-61290d5ed7ab4c918402fd2510533a9b
      Yani evet. Bir Electron uygulaması ve Svelte, headless-ui, tailwindcss vb. kullanıyor.
    • İndirme konumunu sormasını sağlamak gerekiyor.
    • Bir diğer eksi de yalnızca Apple Silicon Mac’lerde çalışması.
    • O 1GB boşta bellek kullanımının süreç başına mı, yoksa 7 sürecin toplamı mı olduğunu merak ediyorum.
  • Yerel çıkarım seçenekleri zaten epey fazla; önemli olan, açık kaynak olmaları ve özelliklerinin de daha sağlam olması.
    Burada “Ama Auto1111 ya da Comfy’nin arayüzü kullanıcı dostu değil ki” diye savunma yapılacak olsa bile, o da zaten çözülmüş durumda: https://github.com/invoke-ai/InvokeAI

    • InvokeAI’ye geçtim ve sanırım artık varsayılan a1111 webui’ye dönmem. Genel yerleşimini seviyorum; iş akışı özelliği var; bir görseli oluştururken kullanılan prompt, model, LoRA gibi tüm özellikleri kolayca geri çağırabiliyorsunuz.
      Panolarla düzenlemek de mümkün; panolar, görseller ve meta verilerin tamamı iyi tasarlanmış bir SQLite veritabanında saklanıyor ve DataGrip ile erişilebiliyor.
    • Krita’ya difüzyon yapay zeka eklentisi takarak kullanma yolu da var: https://github.com/Acly/krita-ai-diffusion
    • Stable Diffusion’ı yerelde çalıştırma” pazarlama ifadesi biraz tuhaf. Açıkçası bu zaten kolayca yapılabilen bir şey.
    • Arayüzünün kullanıcı dostu olup olmadığını bilmiyorum ama sadece InvokeAI kurulum süreci bile dünyadaki insanların %99,9’u için zaten bir engel. Bu, Noiselith’in açık kaynak olamayacağı anlamına gelmiyor; ama InvokeAI’den kesinlikle farklı bir şey sunuyor.
  • Henüz denememiş olanlara Fooocus’u şiddetle öneririm: https://github.com/lllyasviel/Fooocus
    Yerel Stable Diffusion pipeline’ları inanılmaz derecede çok, ama bu araç kısa prompt’larla bile varsayılan çıktı kalitesinde ezici derecede iyi. Gerçekten etkileyici.
    Bunun nedeni, diğer arayüzlerin uygulamadığı ya da varsayılan olarak açmadığı çok sayıda SDXL güçlendirme özelliğini bir araya getirmesi. Stable Diffusion 1.5’ten beri kullanıyorum ve bu alanı epey takip ettim; ComfyUI bir yana, diffusers üzerinde eşdeğer bir pipeline kurmak bile eziyet olurdu gibi geliyor. SDXL için “hit’ler derlemesi ve en iyi varsayılanlar” gibi hissettiriyor.

    • Python ayarlarından çekiniyordum; üstelik Python geliştiricisi olmama rağmen. Yine de bir sanal ortam oluşturup bağımlılıkları kurunca bitiyor. Gerçekten harika ve üretilen görseller doğrudan güzel görünüyor.
      Ancak yan yorumda söylendiği gibi GTM’i paketlemiş olmaları hoş görünmüyor.
      Örnekler:
      https://imgz.org/i9oicVqo/
      https://imgz.org/i8Ur3WjW/
      https://imgz.org/i5j6r6TZ/
    • Fooocus’un kendi barındırmalı kurulum sürümündeki web UI, kullanıcıyı Google Tag Manager’a satıyormuş gibi görünüyor.
      Umarım sektörümüzün tamamı bu tür gözetimi çalıştırmanın kötü bir tercih olduğunu fark eder ve sadece durur.
    • Mac’te kendiniz derlemeniz gerekiyor; Python projelerini derlemenin ne kadar “keyifli” olduğunu hepimiz biliyoruz.
    • En iyi yerel üretim sonuçlarını istiyorsanız Fooocus çok daha iyi. Lvmin tüm enerjisini güzel resimler üretmeye harcıyor. GPL lisanslı olması da benim için artı.
    • Çok fazla RAM’i olan yalnızca CPU kullanan sistemlerde de işe yarar mı merak ediyorum.
  • İlginç. Son birkaç aydır eğlencesine kullandığım https://diffusionbee.com ile karşılaştırmayı düşünüyorum.

    • İkisini de kontrol ettim; Noiselith çok, çok daha iyi sonuçlar veriyor.
  • Pazarlama açısından iyi olabilir ama cihaz üzerinde çalışma ve çevrimdışı kullanımı ana farklılaştırıcı olarak öne çıkarmak tuhaf. Çünkü çoğu kişinin Stable Diffusion’ı zaten bu şekilde kullanıyor olma ihtimali yüksek
    Kurulumun ve kullanımın kolay olmasına daha çok odaklanmak daha iyi olur gibi. Bu hâlâ pek iyi çözülemeyen bir alan. Benim ölçütüme göre ControlNet, upscaling, yüz detaylandırıcı türleri ve mümkünse bölgesel prompting yoksa kullanmam
    Ayrıca kendi SD üreticisini yapmak isteyen insanların, hâlihazırda var olan açık kaynak projelerinden birine katkı verse iyi olur diye de düşünüyorum
    Uygulama mağazası iyi bir fikir olabilir ama Auto1111 ve sayısız eklentisinin olduğu bir dünyada Stable Diffusion topluluğunda pek iyi karşılanacağını sanmıyorum

    • “Pazarlama açısından iyi” sözü işin özü. Bunun üzerine daha fazla gitmeleri gerekiyor. Tuhaf görünen tam o nokta, bu ürünün hedef kitlesini gösteriyor. Zaten SD kullananları değil, Dall-E gibi yalnızca çevrimiçi hizmetleri kullanan insanları dönüştürmeye çalışıyor
    • A1111 gibi şeyleri kullanmayan epey insan olduğunu sanıyorum. Bunu indiriyorsun, o da şunu indiriyor, sonra o da başka bir şey indiriyor; ardından da şu dosyayı ve bu dosyayı elle indirmen gerekiyor gibi karmaşık kurulum modeli yüzünden
      Mevcut kullanıcılara cazip gelmese bile daha basit bir ürün yeni kullanıcılara fazlasıyla hitap edebilir
    • Stable Diffusion için tuhaf şekilde çok sayıda bulut sarmalayıcısı olduğunu gördüm. Bu yüzden en başta açıkça cihaz üzerinde/çevrimdışı demelerini seviyorum
      SD’yi ilk kurcaladığımda, birkaç dosyayı indirip çalıştırmak yerine ciddi şekilde eve telefon eden ya da VM gibi şeyler kullanan paketlerin çok olması bana tuhaf gelmişti
    • Cihazda SD kullandım ama barındırılan sürüme para vermenin değerli olduğunu düşündüm. Çünkü çok daha hızlı
  • Satış amaçlı prompt “fantezi dünyası arka planının önünde baştan çıkarıcı bakışlarla, bacaklarını açarak oturan, beyaz gömlek ve kot hot pants giymiş, sarı kıvırcık saçlı genç bir kadın” mı gerçekten
    Bunun gerçekten doğru olup olmadığını merak ediyorum

    • Prompt bir miktar cinsel, tartışmalı ya da rahatsız edici olmasaydı, “yine de midjourney/dall-e/imagen kadar iyi değil” korosuna doğrudan maruz kalırdı. Kısıtlamalardan özgürlük başlıca satış noktalarından biri
    • Açık kaynak topluluğunda kaç kişinin böyle projeler yapmak için ter ve kan döktüğünü gerçekten merak ediyorum. Sonuçta erkeklerin MacBook’larını Instagram porno kitabına çevirmesini sağlıyor olsa da
    • Uygunsuz bulan tek kişinin ben olmamama sevindim. Epey köpek düdüğü gibi hissettiriyor
    • Bu gerçekten ürpertici
  • Kurulumdan sonra Windows makinede çalıştırmak için genel ve özel ağ erişimi izni vermem gerekti. “Çevrimdışı” deyip bunu istemesi biraz içime sinmedi

    • Benzer bir şey yaşadım
      İlk çalıştırmada yaklaşık 30 GB veri indirdi. Sonraki çalıştırmalarda çevrimdışı çalışıp çalışmayacağını bilmiyorum. Benim durumumda ondan sonra sürekli çöktüğü için tekrar çalışmadı
      Kaldırırken de tüm verileri geride bıraktı. Kullanıcı verisi değil; çalıştırılabilir dosyanın kendisi, Python sanal ortamı, güncelleyici ve tüm modeller kaldı. Kaldırma işlemi fiilen yalnızca Başlat menüsü kısayolunu silmekten ibaretti
    • İnterneti tamamen kesince çalışmaya devam edip etmediğini merak ediyorum
      Çalıştırmak için etkin bir internet bağlantısı gerekiyorsa “çevrimdışı” diye reklamını yapmak tamamen yanlış
  • Daha fazla yerel istemci çıkması kesinlikle sevindirici. Diğer yorumlarda belirtildiği gibi zaten harika olanlar da var. automatic1111’ı denedim; hızlı ve çok fazla ayar gerektirmiyor ama yine de çok sayıda düğme ve seçenek var, bu yüzden başta zorlayıcı geliyor. Fooocus çok hızlı ama doğal olarak özelleştirme daha az
    Bir de ComfyUI var. Karmaşıklığın kutsal kâsesi gibi ama tam da bu karmaşıklık sayesinde gerçekten çok şey yapabiliyorsunuz. Düğüm tabanlı bir uygulama olduğu için özel iş akışları oluşturabiliyor, görüntü üretildikten sonra o “düğümü” başka bir yere gönderip upscaling gibi son işlemler yapabiliyorsunuz
    Noiselith’in veya diğer araçların SDXLTurbo’yu destekleyip desteklemeyeceğini görmek istiyorum. Çıkalı yalnızca birkaç gün oldu ama bence oyunu tamamen değiştiren bir şey. Tüketici sınıfı GPU’da 512x512 bir görüntüyü yaklaşık 0,5 saniyede oluşturabiliyor. Kalitesi inanılmaz değil ama “ormandaki tilki” yazıp anında görmek, ardından “şapkalı”yı ekleyip yine anında üretmek çok değerli. Önceden tek bir görüntü için 12 saniye bekliyordum. Önemsiz gibi gelebilir ama bu kadar hızlı yineleme yapabilmek, yerel görüntü üretimini çok daha eğlenceli hâle getiriyor

  • Henüz test edemedim ama Comfy’de CoreML kullandığım için, daha kullanışlı bir frontend çıkarsa bu platformların backend optimizasyonu ve performans çalışmaları da daha fazla artar mı diye merak ediyorum
    512 görüntülerde 1~4it/s çok hayal kırıklığı yaratıyor; 1024’te 2~3s/it de günümüz ölçütlerine göre çok yavaş. Üstelik ANE’nin bile MacBook Pro M3’te SD 1024x1024 görüntüyü çalıştıramaması üzücü