- Meta Fundamental AI Research (FAIR) yeni araştırma çıktılarını yayımladı
- İnovasyon, yaratıcılık, verimlilik ve sorumluluk olmak üzere temel temalara odaklanan 6 araştırma sonucunu içeriyor
Meta Chameleon
- Metin ve görselleri girdi olarak alıp, metin ve görsel kombinasyonları üretebilen birleşik mimari model
- Diffusion tabanlı eğitim yerine tokenization kullanarak metin ve görselleri işler; bu da bütünleşik bir yaklaşım sağlarken tasarım, bakım ve ölçeklemeyi kolaylaştırır
- Chameleon 7B ve 34B modellerinin başlıca bileşenleri, yalnızca araştırma amaçlı lisansla yayımlandı
- Görsel üretim modeli henüz yayımlanmadı
Multi-Token Prediction
- Kelimeleri tek tek tahmin eden mevcut yaklaşım yerine, birden fazla kelimeyi aynı anda tahmin eden yeni bir yaklaşım öneriyor
- Model performansı ve eğitim verimliliği artarken hız da yükseliyor
- Kod tamamlama için önceden eğitilmiş model, ticari olmayan/yalnızca araştırma amaçlı lisansla yayımlandı
JASCO (Joint Audio and Symbolic Conditioning for Temporally Controlled Text-to-Music Generation)
- Metin istemlerini müzik kliplerine dönüştüren bir metinden müziğe üretim modeli
- Belirli akorlar veya ritimler gibi çeşitli girdileri alarak üretilen müzik çıktısı üzerinde daha iyi kontrol sağlıyor
- Information bottleneck layer ve temporal blurring uygulayarak belirli denetimlerle ilgili bilgileri çıkarıyor
- Değerlendirme sonuçlarına göre üretim kalitesi referans modelle benzer, ancak çok daha çeşitli kontrol imkânı sunuyor
- Araştırma makalesi ve örnek sayfası yayımlandı; çıkarım kodu ve önceden eğitilmiş modelin de daha sonra yayımlanması planlanıyor
AudioSeal
- Yapay zeka tarafından üretilen sesi tespit etmek için bir ses watermarking tekniği
- Daha uzun ses klipleri içinde yapay zeka üretimi bölümleri doğru şekilde tespit edebiliyor
- Mevcut karmaşık decoding algoritmaları yerine yerel tespit yaklaşımı kullanarak hız ve verimliliği artırıyor
- Ticari lisansla yayımlanıyor ve çeşitli üretken yapay zeka araçlarının kötüye kullanımını önlemeye yönelik araştırmaların bir parçası
PRISM veri seti yayımlama desteği
- LLM’leri geliştirmek için farklı insanlardan geri bildirim almak önemli
- Geri bildirim sürecinin yöntemi, alanı ve hedefleri konusunda araştırma topluluğunda sorular gündeme geliyor
- Meta, 75 ülkeden 1.500 farklı katılımcının sosyodemografik özelliklerini ve tercihlerini haritalayan PRISM veri setinin yayımlanmasını destekliyor
- Veri seti, 21 LLM ile yapılan 8.011 gerçek zamanlı sohbet için kişilerin tercihlerini ve ayrıntılı geri bildirimlerini eşliyor
- Amaç, yapay zeka geliştirme süreçlerine daha geniş katılımı ve daha kapsayıcı teknoloji tasarımı yaklaşımlarını teşvik etmek
Metinden görsele üretim sistemlerinde coğrafi uçurumların ölçülmesi ve iyileştirilmesi
- Metinden görsele modellerin herkes için iyi çalışması ve dünyanın coğrafi ile kültürel çeşitliliğini yansıtması önemli
- Potansiyel coğrafi uçurumları değerlendirmek için "DIG In" adlı otomatik bir metrik geliştirildi
- 65.000’den fazla anotasyon ve 20’den fazla anket yanıtı toplanarak insanların coğrafi temsilleri nasıl algıladığı incelendi
- İnsanların coğrafi temsili, görüntünün tamamından ziyade içindeki belirli bileşenlere bakarak algıladığı ortaya çıktı
- Buna dayanarak, metinden görsele modellerin çıktı çeşitliliğini iyileştirme yolları araştırıldı
- Contextualized Vendi Score guidance ile, görsel kalitesi ve istem-üretim tutarlılığı korunurken üretilen örneklerin temsil çeşitliliği artırıldı
Henüz yorum yok.