11 puan yazan brainer 2024-05-14 | 5 yorum | WhatsApp'ta paylaş

• Metin, ses ve görüntüyü aynı anda işleyip üretebilen çığır açıcı bir yapay zeka modeli
• İnsan konuşmasına yakın gerçek zamanlı yanıt süresiyle GPT-4o, doğal insan-bilgisayar etkileşimi için yeni bir standart belirliyor
• API'de daha hızlı ve daha maliyet verimli olmasının yanı sıra metin ve kodda, özellikle İngilizce dışındaki dillerde, GPT-4 Turbo'nun performansını geride bırakıyor
• GPT-4o'nun çok modlu yetenekleri sayesinde ses girişini anlayıp yanıtlayabiliyor, ses çıktısı üretebiliyor ve gerçek zamanlı konuşmalara katılabiliyor
• Model, gelişmiş akıl yürütme, çok dilli yetkinlik, ses ve görsel anlama ile görsel algılama sergiliyor
• OpenAI, potansiyel riskleri azaltmak için GPT-4o'nun tasarımında ve sonrasındaki eğitiminde uygulanan güvenlik önlemlerini vurguluyor
• İlk sürüm; metin ve görüntü girişi ile metin çıktısını içeriyor, ses ve video özellikleri ise gelecekte API'nin güvenilir iş ortakları tarafından kullanılabilecek

5 yorum

 
bluejoyq 2024-05-14

Hızın gerçekten çok arttığı hissediliyor

 
brainer 2024-05-14

Korece olarak soru sorarsanız,

modelin kendi performansı 2 kat * 1.7 (Korece token iyileştirmesi) = 3.4 kat daha hızlı oldu

 
xguru 2024-05-14

4O'daki O, Omni anlamına gelir.

 
corelyai 2024-05-14

ChatGPT'nin en son güncellemesi: GPT-4o modeli ve geliştirilmiş kullanıcı erişilebilirliği

ChatGPT, herkesin gelişmiş yapay zeka araçlarını ücretsiz kullanabilmesine odaklanıyor. Masaüstü sürümünün ve yeni amiral gemisi model GPT-4o'nun kullanıma sunulması, kullanıcılar için doğallığı ve kullanım kolaylığını iyileştirmeyi hedefliyor. GPT-4o; metin, görsel ve ses genelinde daha hızlı ve geliştirilmiş yetenekler sunarak insan ve makine iş birliğinde önemli bir ilerleme sağlayacak.

GPT-4o ile ChatGPT'nin genişlemesi

Artık tüm kullanıcılara sesli, metinsel ve görsel akıl yürütme yetenekleri sunan GPT-4o'yu sunuyoruz. Yeni özellikler arasında gerçek zamanlı konuşma sesi, bellek, gerçek zamanlı bilgi arama ve gelişmiş veri analizi yer alıyor. GPT-4o 50 dilde sunuluyor; kalite ve hız iyileştiriliyor ve ücretli kullanıcılar için kapasite sınırları daha yüksek olacak.

ChatGPT'nin yeni gerçek zamanlı ve tepkisel özellikleri

ChatGPT'nin yeni özellikleri, gerçek zamanlı tepki verebilme ve kullanıcının duygularını algılama yeteneği sunuyor. Model; dramatik ses, robot sesi ve şarkı söyleyen ses gibi çeşitli ses stilleri üretebiliyor. Ayrıca ChatGPT artık görsel görevleri destekliyor ve canlı demo ortamında kullanıcıyla etkileşime girebiliyor.

Doğrusal denklem çözme: adım adım

Barrett Zoph ve ChatGPT, 3X + 1 = 4 denklemini çözerken önce X terimini izole ediyor, ardından X'i buluyor ve sonrasında maliyetler, seyahat planlaması ve iş hesaplamaları gibi günlük hayatta doğrusal denklemlerin gerçek kullanım alanlarını tartışıyor. Bu, matematiği anlamak ve onu gerçek problemlerde kullanmak konusunda yeni bir güven kazandırıyor.

ChatGPT ile hava durumu verisi analizi

ChatGPT, kod işlevlerini açıklayıp grafik çıktısını yorumlayarak hava durumu verilerini analiz etmeye yardımcı oluyor. 'Fu' işlevi, sıcaklık verisini yumuşatmak ve grafikteki gürültüyü azaltmak için kritik önem taşıyor. Grafik, 2018 yılı boyunca yumuşatılmış ortalama, en düşük ve en yüksek sıcaklıkları gösterirken, Eylül sonlarında gerçekleşen büyük yağış olayına dair dikkat çekici bir not da içeriyor.

Çok dilli etkileşim ve yapay zeka teknolojisi

Yapay zeka teknolojisi, canlı demo aracılığıyla çok dilli etkileşim ve duygu yorumlama yeteneklerini sergiliyor. Bu demo, yakın gelecekte kullanıcıların bu teknolojiye daha kolay erişebilmesini sağlama hedefini vurguluyor. Sunum ayrıca teknolojik gelişime katkıda bulunan ekibi ve onların emeklerini de takdir ediyor.

Corely, YouTube'daki kilit içeriği 10 saniyede! - https://corely.ai/content/openai-spring-update-2022

 
xguru 2024-05-14

Introducing GPT-4o

Tanıtım videosundaki gerçek zamanlı konuşma demosu gerçekten sarsıcı. Yaklaşık 9:45'ten itibaren başlıyor (yukarıdaki bağlantıyı da o noktadan başlatacak şekilde ayarladım).
Artık yanıtın ortasında kolayca araya girmek mümkün, neredeyse gerçek zamanlı yanıt veriyor ve tonlaması da çok daha zenginleşmiş.