1 puan yazan GN⁺ 2023-09-26 | 1 yorum | WhatsApp'ta paylaş
  • OpenAI, ChatGPT'ye yeni ses ve görsel özellikler ekliyor
  • Yeni özellikler, kullanıcıların sesli konuşmalar yapması veya ChatGPT'ye görseller göstermesi gibi daha sezgisel bir arayüz sunuyor
  • Kullanıcılar bu özellikleri, bir simge yapının fotoğrafını çekip gerçek zamanlı sohbet etmekten buzdolabı ve kilerin fotoğrafını çekip akşam yemeği menüsüne karar vermeye kadar çeşitli şekillerde kullanabilecek
  • Özellikler önümüzdeki iki hafta içinde Plus ve Enterprise kullanıcılarına sunulacak; ses özelliği iOS ve Android'de, görsel özelliği ise tüm platformlarda kullanılabilecek
  • Yeni ses özelliği, yalnızca metin ve birkaç saniyelik örnek sesle insan benzeri ses üretebilen bir text-to-speech modeli tarafından destekleniyor
  • Ses özelliği, profesyonel ses oyuncularıyla iş birliği içinde geliştirildi ve konuşulan kelimeleri metne dönüştürmek için OpenAI'nin açık kaynaklı ses tanıma sistemi Whisper'ı kullanıyor
  • Görsel anlama özelliği, çeşitli görsellere dilsel akıl yürütme yeteneklerini uygulayan GPT-3.5 ve GPT-4 tarafından destekleniyor
  • OpenAI, bu özellikleri güvenli ve faydalı kullanımı sağlamak ve kullanıcıları gelecekteki daha güçlü sistemlere hazırlamak için kademeli olarak dağıtıyor
  • Yeni ses teknolojisi, kamusal figürleri taklit etmek veya dolandırıcılık yapmak isteyen kötü niyetli aktörler için potansiyel riskler barındırıyor
  • Görsel tabanlı modeller de yeni zorluklar ortaya koyuyor; örneğin insanlar hakkında halüsinasyon üretme veya yüksek riskli alanlarda modelin görsel yorumuna güvenme gibi
  • OpenAI, bireylerin gizliliğine saygı göstermek için ChatGPT'nin insanlar hakkında analiz yapma ve doğrudan yorumda bulunma yeteneklerini sınırlayan önlemler aldı
  • OpenAI, özellikle araştırma ve Latin alfabesi dışındaki yazı sistemlerine sahip diller alanlarında modellerin sınırlamaları konusunda şeffaf davranıyor
  • Plus ve Enterprise kullanıcıları önümüzdeki iki hafta içinde ses ve görsel özellikleri deneyebilecek; geliştiriciler dahil diğer kullanıcı grupları da kısa süre sonra erişim sağlayacak

1 yorum

 
GN⁺ 2023-09-26
Hacker News yorumları
  • ChatGPT’nin yeni ses ve görüntü özellikleri potansiyel taşıyor, ancak sorgu ile yanıt arasındaki gecikme süresi endişe yaratıyor.
  • Bu teknoloji robot planlamasında kullanılabilir ve bu da genel amaçlı robotların basit işleri yapmasına yol açabilir.
  • ChatGPT’deki ilerlemeler, çok modlu özellikler geliştirmeye çalışan birçok startup’ın düzenini bozabilir.
  • Uygun bir duyuru yapılmadan web’de gezinme özelliğinin kaldırılmış olması hayal kırıklığı yaratıyor.
  • Yeni özellikler, uygulama kullanıcı arayüzlerinde sağlam yapay zeka tabanlı görüntü tanıma için kullanılabilir ve çalıştırılabilir test otomasyon kodu üretebilir.
  • En sezgisel kullanıcı deneyimi metin tabanlı sohbet gibi görünüyor, ancak görüntülerle etkileşim de ilgi çekici.
  • Görüntü desteğinin eklenmesi, öğrenciler tarafından ödev yanıtları almak için kötüye kullanılabilir.
  • OpenAI’nin yeni özellikler ve kademeli dağıtım konusundaki iletişiminin yetersiz olduğuna dair eleştiriler var.
  • Yeni özellikler, hobi projelerinde çeşitli yapay zeka servislerini entegre etmenin karmaşıklığını ve gecikmesini azaltabilir.
  • ChatGPT’nin "harika demo" modunda kaldığı ve programları açıklamak için sesi kullanmak gibi potansiyelini tam olarak değerlendirmediği yönünde eleştiriler var.