3 puan yazan xguru 2024-06-21 | Henüz yorum yok. | WhatsApp'ta paylaş
  • Meta Fundamental AI Research (FAIR) yeni araştırma çıktılarını yayımladı
  • İnovasyon, yaratıcılık, verimlilik ve sorumluluk olmak üzere temel temalara odaklanan 6 araştırma sonucunu içeriyor

Meta Chameleon

  • Metin ve görselleri girdi olarak alıp, metin ve görsel kombinasyonları üretebilen birleşik mimari model
    • Diffusion tabanlı eğitim yerine tokenization kullanarak metin ve görselleri işler; bu da bütünleşik bir yaklaşım sağlarken tasarım, bakım ve ölçeklemeyi kolaylaştırır
    • Chameleon 7B ve 34B modellerinin başlıca bileşenleri, yalnızca araştırma amaçlı lisansla yayımlandı
    • Görsel üretim modeli henüz yayımlanmadı

Multi-Token Prediction

  • Kelimeleri tek tek tahmin eden mevcut yaklaşım yerine, birden fazla kelimeyi aynı anda tahmin eden yeni bir yaklaşım öneriyor
    • Model performansı ve eğitim verimliliği artarken hız da yükseliyor
    • Kod tamamlama için önceden eğitilmiş model, ticari olmayan/yalnızca araştırma amaçlı lisansla yayımlandı

JASCO (Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation)

  • Metin istemlerini müzik kliplerine dönüştüren bir metinden müziğe üretim modeli
    • Belirli akorlar veya ritimler gibi çeşitli girdileri alarak üretilen müzik çıktısı üzerinde daha iyi kontrol sağlıyor
    • Information bottleneck layer ve temporal blurring uygulayarak belirli denetimlerle ilgili bilgileri çıkarıyor
    • Değerlendirme sonuçlarına göre üretim kalitesi referans modelle benzer, ancak çok daha çeşitli kontrol imkânı sunuyor
    • Araştırma makalesi ve örnek sayfası yayımlandı; çıkarım kodu ve önceden eğitilmiş modelin de daha sonra yayımlanması planlanıyor

AudioSeal

  • Yapay zeka tarafından üretilen sesi tespit etmek için bir ses watermarking tekniği
    • Daha uzun ses klipleri içinde yapay zeka üretimi bölümleri doğru şekilde tespit edebiliyor
    • Mevcut karmaşık decoding algoritmaları yerine yerel tespit yaklaşımı kullanarak hız ve verimliliği artırıyor
    • Ticari lisansla yayımlanıyor ve çeşitli üretken yapay zeka araçlarının kötüye kullanımını önlemeye yönelik araştırmaların bir parçası

PRISM veri seti yayımlama desteği

  • LLM’leri geliştirmek için farklı insanlardan geri bildirim almak önemli
    • Geri bildirim sürecinin yöntemi, alanı ve hedefleri konusunda araştırma topluluğunda sorular gündeme geliyor
    • Meta, 75 ülkeden 1.500 farklı katılımcının sosyodemografik özelliklerini ve tercihlerini haritalayan PRISM veri setinin yayımlanmasını destekliyor
    • Veri seti, 21 LLM ile yapılan 8.011 gerçek zamanlı sohbet için kişilerin tercihlerini ve ayrıntılı geri bildirimlerini eşliyor
    • Amaç, yapay zeka geliştirme süreçlerine daha geniş katılımı ve daha kapsayıcı teknoloji tasarımı yaklaşımlarını teşvik etmek

Metinden görsele üretim sistemlerinde coğrafi uçurumların ölçülmesi ve iyileştirilmesi

  • Metinden görsele modellerin herkes için iyi çalışması ve dünyanın coğrafi ile kültürel çeşitliliğini yansıtması önemli
    • Potansiyel coğrafi uçurumları değerlendirmek için "DIG In" adlı otomatik bir metrik geliştirildi
    • 65.000’den fazla anotasyon ve 20’den fazla anket yanıtı toplanarak insanların coğrafi temsilleri nasıl algıladığı incelendi
    • İnsanların coğrafi temsili, görüntünün tamamından ziyade içindeki belirli bileşenlere bakarak algıladığı ortaya çıktı
    • Buna dayanarak, metinden görsele modellerin çıktı çeşitliliğini iyileştirme yolları araştırıldı
    • Contextualized Vendi Score guidance ile, görsel kalitesi ve istem-üretim tutarlılığı korunurken üretilen örneklerin temsil çeşitliliği artırıldı

Henüz yorum yok.

Henüz yorum yok.