8 puan yazan GN⁺ 2025-06-29 | 1 yorum | WhatsApp'ta paylaş
  • FLUX.1 Kontext [dev], daha önce yalnızca özel kullanımda olan üretken görüntü düzenleme modelinin open-weight sürümü olarak ücretsiz yayımlandı
  • 12B parametre ile tüketici sınıfı donanımda çalışabiliyor ve ücretsiz araştırma ile ticari olmayan kullanım için dağıtılıyor
  • İnce yerel/genel düzenleme, karakter tutarlılığını koruma, yinelemeli düzenlemeler gibi ticari düzeyde yüksek kaliteli görüntü düzenleme performansı sunuyor ve ComfyUI, Hugging Face Diffusers, TensorRT gibi popüler framework'lerle anında entegre olabiliyor
  • Performans değerlendirmelerinde mevcut açık ve kapalı modellerden (ör. Google's Gemini-Flash Image) daha iyi sonuçlar gösterdi
  • NVIDIA Blackwell mimarisi için optimize edilmiş TensorRT varyantları (BF16, FP8, FP4) da sunuluyor ve en yeni donanımlarda belirgin hız ve verimlilik artışı sağlıyor
  • Ticari lisans ve self-service portalı sayesinde işletmelerde de kolayca entegre edilip kullanılabiliyor

Tanıtım ve önemi

  • FLUX.1 Kontext [dev], Black Forest Labs'ın yayımladığı en yeni üretken görüntü düzenleme modeli
  • Bugüne kadar başarılı görüntü üretme/düzenleme modellerinin çoğu özel olarak sunuluyordu; artık open-weight olarak sunulduğu için herkes araştırma ve ticari olmayan amaçlarla kullanabiliyor
  • Model 12B parametreden oluşuyor; güçlü performans sunarken genel tüketici donanımında da çalışabilecek verimliliğe sahip

Yayımlanma ve erişilebilirlik

  • FLUX.1 Kontext [dev], FLUX.1 ticari olmayan lisansı altında yayımlandı; araştırma ve ticari olmayan kullanım için ücretsiz sunuluyor
  • Model ağırlıkları HuggingFace üzerinden kolayca indirilebiliyor ve ComfyUI, HuggingFace Diffusers, TensorRT gibi başlıca yapay zeka framework'leriyle uyumlu
  • FAL, Replicate, Runware, DataCrunch, TogetherAI gibi iş ortakları; bulut ve yerel ortamlarda hemen kullanılabilecek API endpoint'leri ve kod sağlıyor

Görüntü düzenlemede yeni standart

  • FLUX.1 Kontext [dev], görüntü düzenleme işleri için özelleştirilmiş durumda
    • Yinelemeli düzenlemelerde ve farklı sahne/ortamlarda karakter koruma konusunda güçlü
    • Hassas yerel ve genel düzenleme desteği sunuyor
  • Black Forest Labs'ın hedefi, özel modellere rakip olabilecek açık araçlar sunmak
  • Büyük ölçekli benchmark'larda (ContextBench vb.) ByteDance Bagel, HiDream-E1-Full gibi mevcut açık modellerin ve Google Gemini-Flash Image gibi ticari modellerin önünde daha üstün performans sergilediğini gösterdi
  • Artificial Analysis gibi dış kuruluşların bağımsız değerlendirmeleri de aynı sonucu doğruladı

Donanım optimizasyonu ve farklı seçenekler

  • NVIDIA ile iş birliği yapılarak en yeni Blackwell mimarisi için optimize edilmiş TensorRT ağırlıkları sunuluyor (enerji ve hız için optimize edilmiş BF16, FP8, FP4 sürümleri)
  • Geliştiriciler ihtiyaçlarına göre hız, verimlilik ve kalite dengesi arasında kolayca seçim yapabiliyor

Ticari kullanım için lisans ve portal

  • Black Forest Labs, koşulları şeffaf olan bir self-service lisans portalı açtı ve tüm open-weight modeller için ticari/ticari olmayan erişimi sadeleştirdi
  • Şirketler portaldan kolayca lisans satın alıp FLUX.1 ailesindeki modelleri iş hizmetlerine hızlıca entegre edebiliyor

Lisans güncellemeleri

  • Ticari olmayan amaç tanımı netleştirilerek izin verilen kapsam ve kısıtlamalar daha açık şekilde belirtildi
  • İçerik filtreleme maddesi eklendi; yasa dışı veya hak ihlali içeren içerik üretimini önlemeye ve buna ilişkin sorumluluk reddi hükümlerini güçlendirmeye odaklanıyor
  • İçerik kaynağı ve üretim geçmişi yönetimi, ilgili mevzuata uyumlu olacak şekilde düzenlendi
  • İzin verilmeyen kullanım senaryolarına dair açık örnekler ve ek kısıtlamalar eklendi

Referanslar ve destek

1 yorum

 
GN⁺ 2025-06-29
Hacker News görüşü
  • BFL'nin ağırlıkları yayımlamış olması gerçekten harika bir nokta; açık kaynağın finansal olarak sürdürülebilir olmasının zor olduğu bir gerçeklikte, akademiye ücretsiz sunup startup'lardan makul bir lisans ücreti almak, BFL'nin ve diğer şirketlerin açık ağırlıklı modeller yayımlamayı sürdürmesini sağlayabilecek bir yöntem gibi görünüyor

    • Eğer BFL, kullandığı tüm görsel ve video tabanlı içerikler için önceden açık biçimde kullanım izni ücreti ödemek zorunda olsaydı, bunun finansal açıdan sürdürülebilir olmayacağını düşünüyorum
  • Açık ağırlıkların yayımlanmasıyla, bu tür düzenleme modellerine yeni yetenekler (görevler) eklenebilmesi ilginç bir özellik

    • Az sayıda örnekle (yaklaşık 30 adet) bile iyi genelleme sağladığı görülüyor ve bunu bloglarında paylaştılar
      • Bu Kontext sürümü herkesin beklediği sürüm ve çok daha pratik hissettiriyor
      • Eğitilebilir yeni nesil görüntü üretim modellerinin ilk örneklerinden biri; Gemini, GPT, MJ gibi mevcut büyük modellerde mümkün olmayan bir şey
  • Distill edilmiş Dev modelinin, daha büyük Pro/Max modelleriyle kıyaslandığında da yeterli performansı korumasını umuyorum

    • Son dönemde bu modelin Stable Diffusion gibi eski inpainting tekniklerinin yerini birçok açıdan tamamen alabilmesini bekliyorum
    • Kontext ile görüntü düzenlemede önce/sonra deneylerini burada görebilirsiniz
  • Geçen hafta San Francisco'da düzenlenen hackathon'da bu sistemi bizzat kullandım ve oldukça etkileyici buldum

    • O hackathon'da insanların ne tür projeler yaptığını merak ediyorum
  • Lisansın niyeti, sisteme erişen kişileri sınırlayan bir tür ön filtre işlevi görüyor gibi hissettiriyor

    • Biçimsel olarak açık görünse de pratikte kapsamı daraltıyor ve bu tür bir düzenleme, kimin deneme yapabileceğini çerçeveleyen bir etki yaratıyor
    • Kötüye kullanımı önleme avantajı var, ancak faydalı kullanım alanlarını da kesebilir ve sonuçta yeni deneylerin ölçütlerini bile ince biçimde değiştirme eğilimi taşıyor
  • Yeni uygulanan ticari olmayan kullanım lisansı epey katı kurallar içeriyor; lisans metnine bakabilirsiniz

    • Bu lisans doğru yorumlanırsa, türev eser üretmek için değil yalnızca çıktı üretmek amacıyla olsa bile ticari ortamlarda kullanılamaz
    • Lisansın tam olarak neye uygulandığı soru işareti; muhtemelen kolayca yeniden uygulanabilecek Python kodu gibi şeyler dışında telif hakkı kapsamına giren bir unsur olmadığını düşünüyorum
    • Model ağırlıkları, şirketlerin umduğu kadar telif verilebilecek yaratıcı eserler değil ve telif hakkının yasal tanımına da girmiyor görüşündeyim
    • Veritabanı ya da yazılımdan farklı olarak model ağırlıkları telif koşullarını karşılamıyor; ne kadar yaratıcılık katılmış olduğunun da önemi yok ve telif koruması kapsamına girmiyor
  • Kontext gibi bir modeli, gerçek zamanlı olarak tuval üzerinde yapay zeka ile birlikte çalışıp çizimi tamamlamak için kullanmak isterdim

    • LLM alanındaki zaman serisi tahmini yeniliklerini Google Quick Draw veri kümesi gibi şeylerle birleştirip, fırçayla sohbet ederek resmi tamamladığınız bir “gerçek zamanlı resim partneri” deneyimi çıkmasını gerçekten istiyorum
      • Fal.ai'nin Kontext modelini denediğinizde, önce/sonra dönüşüm kaydırıcısı ve düzenlenmiş görselle sürekli revizyon yapabilme özelliği etkileyici
      • BFL dev modelini de yayımladığına göre, mevcutta Stable Diffusion için eklentileri bulunan Krita için bir Kontext eklentisinin de mutlaka çıkmasını isterim
      • Krita eklentisi referans bağlantısı
  • Bu sistemin yaklaşık ne kadar VRAM ile çalıştığını merak ediyorum

    • Şu an için yaklaşık 18~20GB VRAM gerekiyor, ancak yarın ya da yakın gelecekte, yaklaşık 1 saatlik boş vaktiniz varsa 4GB VRAM'de de çalıştırmak mümkün olabilir
  • Lisansın kısıtlayıcı olması üzücü