- ChatGPT’ye yeni ses ve görüntü özellikleri sunuldu.
- Ses aracılığıyla doğal şekilde sohbet etmek ve görsel ekleyerek soru sormak artık mümkün.
- Ses, Whisper aracılığıyla metne dönüştürülüyor; yanıtlar ise yeni bir TTS modeli temel alınarak profesyonel seslendirme sanatçılarının sesiyle oluşturuluyor.
- Yeni TTS modeli, yalnızca birkaç saniyelik bir ses örneğiyle o kişinin sesini olduğu gibi yeniden üretebiliyor.
- Bu model, Spotify’ın podcast çeviri özelliğinde de kullanılıyor; podcaster’ın kendi sesini koruyarak çok dilli çeviri yapıyor.
- Görseller bir seferde birden fazla eklenebiliyor ve görsel içindeki metnin yanı sıra nesneleri de ayrıntılı biçimde algılıyor.
- Araçların veya cihazların nasıl kullanılacağını sorabilir ya da buzdolabındaki malzemelere göre tarif hakkında sohbet edebilirsiniz.
- Ayrıca grafikleri analiz etmek veya matematik problemlerini çözmek de mümkün hale geldi.
- Mobil uygulamada çizim aracıyla görselin belirli bir bölümüne odaklanması sağlanabiliyor.
- Güvenlik ve gizliliği korumak için insanlar hakkında analiz yapma veya konuşma özellikleri büyük ölçüde sınırlandırılmış durumda.
- Önümüzdeki 2 hafta içinde önce Plus ve Enterprise kullanıcılarına sunulması planlanıyor.
- Ses özelliği yalnızca iOS ve Android’de çalışıyor; görsel ekleme özelliği ise tüm platformlarda kullanılabiliyor.
4 yorum
Skynet geliyor...
Her filmindeki işletim sistemi artık mümkün hale gelebilir gibi görünüyor.
GPT-4 ilk çıktığında kısa bir süreliğine görülmüştü ama görselleri sadece tanımanın ötesine geçip anlayabilmesi gerçekten çok etkileyici.
Örneklere bakınca, bisiklet selesinin nasıl ayarlanacağını sorduğu bir bölüm var;
bu, basit bir görüntü tanımadan ziyade kılavuza bakıp uygun aracı buluyormuş gibi görünüyor...
Plus aboneliği gerekir mi diye düşünmüştüm ama durum böyleyse mesele biraz değişiyor... çok merak ediyorum.
HN dizisinin yapay zeka özeti