1 puan yazan GN⁺ 2023-10-02 | 1 yorum | WhatsApp'ta paylaş
  • Bing Image Creator, metin ve yüklenen görselleri AI görsellerine dönüştüren veya düzenleyen ücretsiz bir araçtır; DALL-E 3 kademeli olarak kullanımdan kaldırılıyor ve mevcut görseller My Creations içinde korunuyor
  • Üretim modeli olarak DALL-E3, GPT4o, MAI-Image-2e arasından seçim yapılabiliyor, ancak yüklenen görsellerin düzenlenmesi yalnızca GPT4o ile işleniyor
  • Kişisel Microsoft Account (MSA) ile oturum açmak gerekiyor; Microsoft Entra ID tabanlı iş veya okul hesapları Image Creator ve Video Creator'da desteklenmiyor
  • Image Creator, günde 15 ücretsiz Fast üretim ve 24 saat başına en fazla 200 istem sunuyor; Video Creator ise Sora 2 tabanlı metinden videoya üretimi destekliyor
  • Yüklenen görseller isteklerin işlenmesi ve hizmetin iyileştirilmesi için kullanılabiliyor, ancak model eğitimi veya kişiselleştirme için kullanılmıyor; yüz tespit edilen yüklenen görseller 30 gün sonra siliniyor

Bing Image Creator ve DALL-E 3 geçişi

  • Bing Image Creator, kullanıcının metni ve yüklediği görselleri temel alarak görsel oluşturan veya düzenleyen bir yapay zeka aracıdır
  • DALL·E 3, içerik üreticilere sunulduktan sonra önümüzdeki birkaç hafta içinde kullanımdan kaldırılacak (retire)
    • Mevcut görseller My Creations içinde kalacak
    • Buna özel bir alternatif özellik hazırlanıyor
    • Bu arada daha yeni modellerle üretim yapılmaya devam edilebilecek

Görsel üretim modelleri ve düzenleme biçimi

  • Görsel üretiminde üç model seçeneği bulunuyor
    • DALL-E3: “Create”e basıldığında isteme dayalı olarak birden fazla görsel üretir ve bu tek bir creation olarak sayılır
    • GPT4o: “Create”e basıldığında isteme dayalı 1 görsel üretir
    • MAI-Image-2e: “Create”e basıldığında birden fazla görsel üretir ve bu tek bir creation olarak sayılır
  • MAI-Image-2e için model kartı ve veri özeti sunuluyor
  • Yüklenen görseller kullanılırken veya düzenlenirken DALL-E3 ve MAI-Image-2e seçilemiyor; tüm düzenlemeler GPT4o ile işleniyor
  • Son kullanılan istemlere benzer isteklerde, sıfırdan yeni bir görsel oluşturmak yerine geçici olarak saklanan bir cached image gösterilebiliyor

Hesap, hız ve kullanım sınırları

  • Bing Image Creator, kişisel Microsoft Account (MSA) ile ücretsiz kullanılabiliyor
    • Microsoft Entra ID ile oturum açan kullanıcılar bunu kullanamıyor
    • Copilot Search veya Bing Search içinde kullanılırken de görsel üretmeden önce oturum açmak gerekiyor
  • Üretim hızı Fast creation ve Standard creation olarak ayrılıyor
    • Her gün ücretsiz 15 Fast image creation veriliyor
    • 15 hakkın tamamı kullanıldığında ertesi gün yenileniyor
    • Fast üretimi kullanmaya devam etmek için Microsoft Rewards puanları kullanılabiliyor
    • Standard creation ücretsiz, ancak Fast'ten daha yavaş
  • Image Creator'da 24 saat başına en fazla 200 istem girilebiliyor
    • “Edit image”e basılması da 200 sınırına dahil
    • Sınır tamamen kullanıldığında ertesi gün yenileniyor
  • Üye olmadan veya misafir olarak üretimde günlük sınırlar var; oturum açıldığında yükleme ve ek modellere erişim kullanılabiliyor

Bing Video Creator

  • Bing Video Creator, Sora 2 ile metin istemine uygun AI videolar üreten bir Bing ürünüdür
  • Video Creator da kişisel Microsoft Account ile oturum açmayı gerektirir; Microsoft Entra ID hesapları desteklenmez
  • Üretim hızı Fast creation ve Standard creation seçenekleri sunar
    • Standard creation ücretsizdir
    • Fast creation için genellikle Microsoft Rewards puanları gerekir
    • Bazı durumlarda Fast creation için kredi verilebilir
  • Aynı anda devam eden en fazla 3 video üretimi sıraya alınabilir
    • Zaten 3 üretim devam ediyorsa, biri tamamlanana kadar yeni video oluşturulamaz
    • Tamamlanan videolar Bing mobil uygulamasındaki Bing Video Creator mini uygulamasında veya bing.com/create üzerindeki “My Creations” bölümünde görülebilir
  • Video üretimi şu anda yalnızca mobilde kullanılabiliyor ve Bing uygulaması üzerinden erişilmesi gerekiyor

Yüklenen görseller ve kişisel verilerin işlenmesi

  • Yüklenen görseller, Bing Image Creator veya Bing Video Creator'ın kullanıcının isteğine göre görsel üretme ya da düzenleme işlemlerini gerçekleştirmesi için kullanılır
  • Yüklenen görseller, görsel işleme hizmetinin iyileştirilmesi için kullanılabilir; ancak AI model eğitimi veya kullanıcı deneyiminin kişiselleştirilmesi için kullanılmaz
  • Yüklenen görsellerde yer alan yüzleri tanımlamaya yönelik girişimde bulunulmaz
  • Saklama süresi görsel içeriğine göre değişir
    • Yüklenen görseller en fazla 30 gün saklanır
    • Yüz tespit edilen görseller 30 gün sonra silinir
    • Yüz tespit edilmeyen görseller en fazla 18 ay saklanabilir
  • Üretilen görseller ve videoların her biri en fazla 90 gün saklanabilir
  • Kullanıcı, Bing arama geçmişinde “Clear all” seçeneğini ya da Microsoft hesap privacy dashboard içindeki “Search history” bölümünde “Clear all search history” seçeneğini kullanarak geçmişi silebilir
    • Bu işlem Bing arama geçmişini, Bing Image Creator ve Video Creator profilini ve üretim geçmişini birlikte siler

Yükleme kısıtlamaları ve biyometrik veriler

  • Kullanıcılar yalnızca kendilerine ait olan veya kullanma hakkına sahip oldukları orijinal görselleri yüklemelidir
  • Üçüncü taraf haklarını ihlal eden, başkalarının mahremiyetini ihlal eden, rıza olmadan kişileri tasvir eden ya da Microsoft Services Agreement veya Bing Image Creator Code of Conduct'u ihlal eden görseller yüklenemez
  • Yasa dışı veya yasaklı içerik yükleme girişimi tespit edilirse hesap kullanımı kısıtlanabilir veya askıya alınabilir
  • Video Creator, güvenlik nedeniyle gerçekçi yüz görsellerinin yüklenip video üretiminde kullanılmasına izin vermez
  • Görsel yükleme özelliğinde yüz veya el gibi biyometrik veriler işlenebilir
    • Biyometrik veriler yalnızca kullanıcı tarafından yüklenmişse işlenir
    • İşleme amacı, kullanıcının isteğine yanıt vermekle sınırlıdır
    • Bazı bölgelerde görsel işlenmeden önce onay gerekebilir
    • Başkalarının görselleri rıza olmadan paylaşılmamalıdır

İstem yazımı ve desteklenen diller

  • Bing Image Creator ve Bing Video Creator 100'den fazla dili destekler; tam listeye Microsoft Translator üzerinden ulaşılabilir
  • Daha iyi sonuç almak için istemleri arama sorgusu gibi kısa yazmak yerine daha somut ve yaratıcı şekilde yazmak daha faydalıdır
    • Konunun görünümü, renk, doku, hareket, arka plan, ışık, kamera açısı ve medya stilini eklemek sonuç kalitesini artırabilir
    • Video istemlerine “action movie”, “fantasy”, “dramatic” gibi temalar ve “direct sunlight”, “dusk”, “soft lighting” gibi ışık ifadeleri eklenebilir
    • Ses içeren videolarda ortam sesi, müzik yönü ve anlatım tonu önerilebilir; ancak tam diyaloglar senaryo olarak belirtilemez

Rewards ve sorumlu yapay zeka

  • Image Creator'da günlük 15 ücretsiz Fast creation hakkı tükendiğinde otomatik olarak Standard creation hızına geçilir
  • Microsoft Rewards puanı kullanımı açılırsa, Fast creation kullanıldığında puan düşülür
    • Image Creator ve Video Creator için Rewards ayarları birbirinden ayrı değiştirilmelidir
    • Puan yetersizse otomatik olarak Standard creation'a geçilir
  • Microsoft, Bing Image Creator ve Bing Video Creator'a zararlı görsel ve video üretimini önleyici kontroller uyguluyor
    • Potansiyel olarak zararlı görsel üretebilecek istemler otomatik olarak engellenir ve kullanıcıya bildirilir
    • Image Creator görsellerinde sol alt köşede filigran gösterilir
    • Hem görsel hem video için C2PA standardı tabanlı içerik kimlik bilgileri ve kaynak bilgisi uygulanır
  • Hayatta olan sanatçılar, ünlüler ve kuruluşlar, Report a Concern form içindeki AI-powered features seçeneği üzerinden adları ve markalarıyla ilgili görsel üretiminin sınırlandırılmasını talep edebilir
  • Beklenmedik veya rahatsız edici içerik üretilirse, Report a concern form ya da arayüzdeki Feedback düğmesi üzerinden Microsoft'a bildirim yapılabilir
  • İçerik politikalarının tekrar tekrar ihlal edilmesi durumunda otomatik geçici askıya alma uygulanabilir; birden fazla askıya alma ise kalıcı kısıtlamaya yol açabilir

1 yorum

 
GN⁺ 2023-10-02
Hacker News yorumları
  • DALL-E’ye göndermeden önce LLM’in prompt’u biraz değiştirdiği anlaşılıyor ve bu kısım jailbreak edilebiliyor
    https://twitter.com/madebyollin/status/1708204657708077294
    https://media.discordapp.net/attachments/1023643945319792731...

    • Girdi ve çıktının sadece metin olmadığı jailbreak örneklerine bakınca, nedenini bilmiyorum ama özellikle iyi sonuç veriyor
    • Hâlâ bir tür splatterprompting yapılıyor; artık bunu makinenin bizim yerimize yapması epey komik
    • Sadece şöyle çağırınca da çalışıyor mu?
      #graphic_art("my prompt here")
    • Nasıl jailbreak edildiğini merak ediyorum
    • 2023’e yakışır şekilde gerçekten cyberpunk bir sahne
  • Bu tür araçlarda genelde olduğu gibi, gerçekten komik ama aynı zamanda rahatsız edici sonuçlar üretmek oldukça kolay görünüyor. Muhtemelen uzun sürmez
    https://www.reddit.com/r/ChatGPT/comments/16wf1i0/dalle_3_is...

    • Rastgele anahtar kelime engellemek yerine, daha fazla açıklama istemek ya da daha az sorunlu hâle getiren yumuşak ayarlamalar ekleseler iyi olurdu
      Elbette insanlar sonunda yapmak istediklerini yapacak; bu yüzden yenilik hissi geçince kendiliğinden bırakmaları da iyi bir yol olabilir
    • Bir şeyi kaçırmış olabilirim ama prompt’ta “fawn” geçti diye nasıl korkunç bir Spongebob çıktığını anlamıyorum
      Düzenleme: Prompt’ta “fawn” yokmuş; yanıtları okuyunca anladım
  • Kazanan: https://www.bing.com/images/create/paint-a-picture-in-the-st...

    • Birilerinin backlog’unda “modele insan elindeki parmak sayısını öğret” diye bir Jira ticket’ı olması hoşuma gidiyor
    • “Parmak sayısı doğru olan eller” isteyince dönen 4 görselden 3’ünde doğru tutturdu
  • Önceki sürüme göre kesinlikle daha iyi görünüyor. Artık en azından bazı durumlarda, görselin içinde yer alacak tam metni üretebiliyor
    Örneğin Neon sign saying "Scotland" prompt’u şu sonucu veriyor: https://www.bing.com/images/create/neon-sign-saying-22scotla...
    Ancak Kubernetes gibi daha az yaygın kelimelerde hâlâ zorlanıyordu; yine de doğru yönde bir adım

  • Bing sohbet arayüzünde “X’in resmini çizebilir misin?” derseniz “Üzgünüm, resim çizemem. Başka nasıl yardımcı olabilirim?” diye yanıt verdikten hemen sonra “Görsel oluşturma zaman alıyor. İlerlemeyi Image Creator’da kontrol edin” mesajı geliyor
    Sohbet yanıtında, görsel çizebildiğini bilmeyen bir LLM kullanılıyor; aynı anda ne çizip göstereceğine karar veren başka bir model paralel çalıştırılıyor gibi

    • “Can you ...?” gibi prompt’lardan kaçınmaya çalışıyorum. Çünkü bir şeyi yapma komutu yerine evet/hayır sorusu olarak yorumlanabilir
      Bing’de “Draw me an image of...” ya da sadece “Image: görsel açıklaması” şeklinde yazınca şimdiye kadar iyi çalıştı
    • Sanırım “draw” fiilinden kaynaklanıyor. LLM sadece kendisinin doğrudan çizemeyeceğini söylüyor; görsel oluşturma muhtemelen çağırdığı bir fonksiyon
      LLM, görsel üreticisini kullandığı bir araç, yani kendisinden ayrı bir varlık olarak görüyor gibi
    • Muhtemelen öyledir. Sohbet/talimat verileriyle eğitilmiş bir LLM’in, Google veya Stable Diffusion gibi ayrı bir sistemle iletişim kurduğunu belirten özel kod çıktısı üretmesini sağlayıp bunu tekrar kullanıcıya iletmeyi denedim ama başarı oranı sınırlıydı
    • Çıktı görsel NSFW olarak algılanırsa sohbet bazen böyle garip hatalar da veriyor. Yanlış pozitifler oldukça fazla
  • Son 24 saatte çeşitli şeyler ürettim; oldukça iyi. Midjourney’nin Discord arayüzünü hiç sevmiyorum

    • Ben de aynı fikirdeyim. Bu kullanım senaryosuna uygun düzgün bir kullanıcı deneyimi geliştirmeden neden bu kadar uzun süre Discord kullandıklarını anlamıyorum. Bu yüzden epey büyüme kaybedecekler gibi
    • Midjourney yalnızca Discord’a mı özel? Öyleyse Discord sunucularına inanılmaz yük biniyor olmalı. Model orada çalışmıyor olsa bile yalnızca depolama ve bant genişliği bile büyük
      Başta çok hızlı ölçeklenmek için oldukça iyi bir yöntem ama Discord’un bundan hoşlanacağını sanmam. Şimdiye kadar kendi arayüzlerini yapmış olurlar diye düşünmüştüm
    • Bununla bağlantılı olarak Instagram da artık DM’lere /imagine komutunu ekledi. Tam bir kopya
  • Bing epey çaresiz görünüyor. Dün cihazıma GPT kurmaya çalışıyordum; ilk uygulama sonucu reklamdı, o da Bing’di ve uygulamayı kullanırsam ödül kazanabileceğimi söylüyordu
    Kullanıcı sayısını artırmakla mı, yoksa o tatlı verileri toplamakla mı daha çok ilgileniyorlar bilmiyorum. Muhtemelen ikisi de

    • Bing Rewards 2010’da çıkmıştı; demek ki sürdürmeye değecek kadar işe yarıyor
      https://en.wikipedia.org/wiki/Microsoft_Bing#:~:text=Bing%20...
    • Google, iOS’ta varsayılan arama motoru konumunu korumak için Apple’a her yıl 20 milyar dolar ödüyor. Asıl çaresizlik bu. İnsanlar nereye gidecek ki, Bing’e mi?
    • Bing 2022’de 12 milyar dolar gelir elde etti. Öylesine söylüyorum
    • Whatsapp’ın da kendi ChatGPT sürümü var. Şu an tam bir silahlanma yarışı yaşanıyor
  • O sayfa başlığının Fransızca yerelleştirmesinin “Créer art de mots avec IA” olmasını sevdim. Neredeyse “all your base are belong to us” düzeyinde berbat bir çeviri
    Muhtemelen yapay zeka çevirisidir; ama Fransızca konuşan biriyseniz bu sayfadaki yapay zeka ürününe güven duymanız zor

    • Neden suçu yapay zeka çevirisine attığınızı bilmiyorum
      ChatGPT-4’ün doğrudan çeviri isteğini nasıl ele aldığını görebilirsiniz: https://chat.openai.com/share/8211a1f6-552b-4bf6-8f9c-bcbeb8...
      Mevcut çeviri paketleri hakkında nasıl konuştuğunu da görebilirsiniz: https://chat.openai.com/share/299e40ce-806b-4f0e-a889-cb2ee2...
      Fransızcayı pek bilmiyorum ama bir miktar bildiğim İspanyolca ve başka dilleri “yapay zeka” ile çevirme deneyimim Google Translate’ten daha olumluydu. Birkaç ay önce ChatGPT-4 ve Google Translate ile İngilizce çevirileri yan yana karşılaştırdım; kıyas bile yoktu
      Microsoft’un bu kötü çeviriyi nereden aldığı belirsiz, ama ChatGPT-4 ile çevrilmiş olsaydı daha az berbat olurdu gibi geliyor
    • Fince çeviri de korkunç bir kelime kelime çeviri. Edatları neredeyse hiç kullanmayan bir dile çevirirken hiç işlemiyor
      “for” veya “to” gibi kelimeler tamamen farklı bağlamdaki kelimelerle değiştirilmiş. 2000 civarındaki makine çevirisini hatırlatıyor
      Ne yazık ki zorunlu OneDrive senkronizasyonu gibi Windows’un yeni özellikleri de benzer şekilde kötü çeviriler kullanıyor. Bugünlerde kimlik avı e-postalarındaki Fince, Windows’unkinden daha iyi
    • Bing’in kullandığı yapay zeka sohbet botu tanıtım sayfasının da çevirisinin berbat olduğunu hatırlıyorum. Karakter düzeyinde bile tuhaftı, rastgele büyük harfler de vardı. Açıkçası bunun nasıl mümkün olabildiğini hâlâ bilmiyorum
    • Çeviri kalitesi kesinlikle çok kötü. Az önce Microsoft Translator ile denedim, çeviri kalitesi fena değildi. Çok tuhaf
  • Tux’u düzgün görünecek şekilde yaptırmış: https://www.bing.com/images/create/tux-the-penguin-lounging-...

  • “2 saat bekleme”, “Yeni görüntüler oluşturmak zaman alabilir”, “Boost’unuz bittiği için görüntü oluşturma normalden uzun sürebilir” diyor
    Microsoft tüm bu özellikleri sunarken acaba ne kadar para yakıyor?
    Son kontrol ettiğimde, bu kadar cömertçe dağıtmalarına rağmen Bing üzerinde pek etkisi olmamış gibiydi, değil mi?
    Bunun “yapabildiğimiz için yapıyoruz” türü bir şey mi, yoksa gerçekten kârlı mı olduğunu merak ediyorum
    [0]: https://searchengineland.com/new-bing-google-market-share-si...

    • Gerçekten büyük şirketler her zaman uzun vadeli stratejik planlarla hareket eder. Bir şey aşırı cömert görünüyorsa, genelde gerçekten öyledir
      Kârlı mı? Muhtemelen hayır. Ama zaten mesele bu. Hizmeti piyasa fiyatının altında sunmak, rakipler ortadan kalkana kadar beklemek, sonra para kazanmak
      Örnek çok, ama aklıma Google Workspace gibi şeyler geliyor. İçeri girmeyi kolay ve ucuz hale getirip insanların ve şirketlerin ürüne alışmasını sağlıyorlar, sonra kurbağayı yavaş yavaş haşlıyorlar
    • Bu iş ilanı çok şey anlatıyor
      https://jobs.careers.microsoft.com/global/en/job/1627555/Pri...
      Slashdot’ta gördüm: https://m.slashdot.org/story/419681
    • İnsanların istedikleri sonucu almak için birden çok prompt’u yineleyip hangi alternatifi seçtiklerini göstermesi, eğitim verisi olarak da değerli olabilir
    • Kurumsal Bing benimsenmesi için kullanılan bir satış aracını tüketicilere de uyguluyor olabilirler. Trafik ve kullanım rakamlarına ihtiyaçları var; bunları elde edince üstüne reklam işini koyup para kazanabilirler
    • Çoğu insan için Bing, Google’ı aramak için kullanılan şeydir
      Edge’in Chrome’u yüklemek için kullanılması gibi
      Ne kadar pazarlama ya da özellik eklerseniz ekleyin, bu cesetleri yeniden yürütmeye yetmez