3 puan yazan GN⁺ 2024-10-15 | 1 yorum | WhatsApp'ta paylaş
  • FLUX, Replicate üzerinde daha hızlı çalışıyor ve optimize edilmiş kodunu açık kaynak olarak yayımlayarak herkesin bunu inceleyip geliştirebilmesini sağlıyor
  • Hız artışının sırrı
    • FLUX modeli Black Forest Labs ile iş birliği içinde yönetiliyor ve iki ana optimizasyon çalışması yürütülüyor
      • Model optimizasyonu: torch.compile ve CuDNN attention kernel'leri kullanılarak performans artırılıyor
      • Yeni bir senkron HTTP API eklenerek görüntü modelinin hızı büyük ölçüde iyileştiriliyor
    • flux-fp8-api kuantizasyonu çıktıda küçük değişikliklere yol açsa da kalite üzerinde büyük bir etki yaratmıyor
    • Optimizasyon yöntemleri şeffaf biçimde paylaşılıyor ve kullanıcıların optimizasyonları devre dışı bırakmasına izin veriliyor
  • Açık kaynağın hızı
    • Açık kaynak modeller çoğu zaman varsayılan olarak yavaş oluyor; model sağlayıcıları bunları optimize edip kapalı API'ler olarak sunabiliyor
    • FLUX'taki tüm iyileştirmeler açık kaynak olarak yayımlanıyor; amaç, toplulukla birlikte daha da hızlı modeller geliştirmek
  • FLUX'un kullanımı
    • FLUX'u Replicate üzerinde çalıştırmanın dışında da çeşitli kullanım senaryoları var
      • FLUX, kullanıcı verileriyle ince ayar yapılabilir
      • Kod değiştirilerek özelleştirilmiş sürümler dağıtılabilir
      • Yeni playground'da model denenip çıktılar karşılaştırılabilir

GN⁺ Özeti

  • FLUX, Replicate'teki performans artışı ve açık kaynak yaklaşımıyla herkesin optimize edilmiş bir modeli kullanabilmesine olanak tanıyor
  • Açık kaynakta hız sorununu çözmeye yönelik bu çaba, toplulukla iş birliği sayesinde daha hızlı modellerin geliştirilmesini mümkün kılıyor
  • FLUX'un farklı kullanım olanakları, kullanıcılara özelleştirilmiş çözümler sunma fırsatı veriyor
  • Benzer işlevlere sahip diğer projeler arasında TensorFlow ve PyTorch bulunuyor

1 yorum

 
GN⁺ 2024-10-15
Hacker News yorumu
  • Metinden görsele dönüştüren modellerin verimsiz olduğunu düşündüğünü, bunu birden fazla aşamaya bölerek işlemenin daha iyi olabileceğini söyleyen bir görüş var. Her aşama bağımsız olarak eğitilebileceği için modülerlik sağlanabileceği ve görsel düzenlemenin daha kolay olacağı düşünülüyor

    • Örneğin, "nesne x, nesne y'nin yanında ve onun üzerinde foo metni var" türünde bir görsel üretmenin daha kolay olacağı açıklanıyor
    • Son render modelinin prompt'tan ayrı var olabileceği, böylece sanatsal stilin veya gerçekçilik düzeyinin ayarlanabileceği belirtiliyor
  • Ticari olmayan yazılımın open source olmadığını vurguluyor; asıl yazar bakım yapmayı bıraktığında başkasının devam edemeyeceğini ya da ücretsiz çalışmak zorunda kalacağını açıklıyor

    • Open source, asıl yazar çalışmayı bıraktığında herkesin geliştirmeyi sürdürmesine izin veren bir lisans sağlar
    • Yalnızca FLUX.1 [schnell] open source (Apache2); FLUX.1 [dev] ise ticari olmayan kullanım için
  • FLUX.schnell'i kolay kullanmak için Pollinations URL'sine prompt girilmesini öneriyor

    • FLUX'un hızının şaşırtıcı olduğunu, yalnızca üç L40S GPU ile her 30 dakikada 8000 görsel üretildiğini belirtiyor
  • Substack'te kullanmak üzere beyaz arka planlı görselleri FLUX ile üretmeyi sevdiğini söylüyor

    • Metinle birlikte görsel olarak bir şey aktarabilmenin hoşuna gittiğini açıklıyor
  • FLUX'un, yerelde barındırılan üretim sistemleri arasında prompt'a uyum açısından önde geldiğini, ancak sığ alan derinliğinin sürekli görünmesinin can sıkıcı olduğunu belirtiyor

  • Midjourney aboneliğini iptal ettiğini ve Replicate ile Ideogram'ı değerlendirdiğini söylüyor

  • FLUX 1.1'in eğitim verisini merak ettiğini, üretilen görsellerin kişisel fotoğraflar gibi göründüğünü açıklıyor

    • Eğitim verisinin herkese açık Facebook gönderileri, Snapchat, Vkontakte vb. kaynaklardan alınıp alınmadığını sorguluyor
  • FLUX 1.1 pro modelinin, önceki açık modelden çok farklı bir eğitim verisi kullanmamış olabileceğini düşünüyor

  • FLUX'un karşılaştırma sayfasına değinerek, hız sürümünün orijinal modelden tamamen farklı görseller gösterdiğini açıklıyor

  • Meta'nın modelleri hakkındaki open source tartışmasına değinerek, FLUX tarafında yalnızca FLUX schnell'in open source olduğunu açıklıyor

    • Meta'nın Llama modelinin daha cömert bir lisansa sahip olduğunu ve FLUX schnell'e göre ince ayar yapmasının daha kolay olduğunu belirtiyor
  • Open source topluluğunun OpenFLUX gibi projeleri desteklemesi gerektiğini savunuyor

  • Ellerin hâlâ garip görünmesi sorununu neden çözemediğini sorguluyor