- Karmaşık problemleri çözmek için yeni bir akıl yürütme modeli
- Model, yanıt vermeden önce problemi daha uzun süre düşünecek şekilde eğitildi
- Eğitimle birlikte düşünme sürecini iyileştirmeyi, farklı stratejiler denemeyi ve hatalarını fark etmeyi öğrendi
- Fizik, kimya ve biyolojideki zorlu benchmark görevlerinde doktora öğrencilerine benzer performans gösteriyor
- Matematik ve kodlamada da üstün sonuçlar veriyor
- Uluslararası Matematik Olimpiyatı (IMO) eleme sınavında GPT-4o yalnızca %13 doğru yaparken, akıl yürütme modeli %83 başarı sağladı
- Codeforces yarışmalarında kodlama yeteneği %89 persentile ulaştı
Güvenlik
- Modelin güvenlik ve hizalama yönergelerine uymasını sağlamak için yeni bir güvenlik eğitimi yaklaşımı geliştirildi
- En zor jailbreak testlerinden birinde GPT-4o 22 puan alırken (100 üzerinden), o1-preview modeli 84 puan aldı
- Güvenlik çalışmaları, iç yönetişim ve federal hükümetle iş birliği güçlendirildi
- Preparedness Framework kullanılarak sıkı test ve değerlendirme
- En üst düzey red team operasyonları
- Safety & Security Committee dahil yönetim kurulu düzeyinde inceleme süreci
- ABD ve Birleşik Krallık yapay zeka güvenliği enstitüleriyle anlaşmalar imzalandı ve uygulamaya alındı
Bu model kimler için
- Özellikle bilim, kodlama ve matematik gibi alanlarda karmaşık problemlerle uğraşanlar için faydalı olabilir
- Örneğin
- Sağlık araştırmacıları hücre dizileme verilerini açıklamalı hâle getirebilir,
- Fizikçiler kuantum optiği için gerekli karmaşık matematiksel formülleri üretebilir,
- Geliştiriciler çok adımlı workflow'lar kurup çalıştırmak için kullanabilir
OpenAI o1-mini
- o1 serisi, karmaşık kodları doğru şekilde üretme ve debug etme konusunda öne çıkıyor
- Geliştiricilere daha verimli çözümler sunmak için o1-mini adlı daha hızlı ve daha ucuz bir akıl yürütme modeli de yayımlandı
- o1-mini, o1-preview'dan %80 daha ucuz
- Akıl yürütmenin gerekli olduğu ancak geniş dünya bilgisinin gerekmediği uygulamalar için güçlü ve maliyet etkin bir model
OpenAI o1 nasıl kullanılır
- ChatGPT Plus ve Team kullanıcıları bugünden itibaren ChatGPT içinde o1 modeline erişebiliyor
- Hem o1-preview hem de o1-mini manuel olarak seçilebiliyor
- Lansmanda o1-preview için haftalık 30, o1-mini için haftalık 50 mesaj sınırı bulunuyor
- ChatGPT Enterprise ve Edu kullanıcıları gelecek haftadan itibaren iki modele de erişebilecek
- API kullanım seviyesi 5'teki geliştiriciler bugünden itibaren API'de 20 RPM hız sınırıyla iki model üzerinde prototiplemeye başlayabilecek
- Bu modellerin API'sinde şu anda function calling, streaming ve system message desteği gibi özellikler bulunmuyor
- Tüm ChatGPT Free kullanıcılarına o1-mini erişimi sunulması planlanıyor
Gelecek planları
- Bu, ChatGPT ve API için akıl yürütme modellerinin ilk önizlemesi
- Model güncellemelerine ek olarak browsing, dosya ve görsel yükleme gibi özellikler eklenerek herkes için daha kullanışlı hâle getirilmesi planlanıyor
- Yeni OpenAI o1 serisiyle birlikte GPT serisi modellerin geliştirilmesine ve yayımlanmasına devam edilmesi planlanıyor
4 yorum
GitHub Copilot ile sinerjisinin nasıl olacağını merak ediyorum.
Bu, hakkında söylentiler çıkan Strawberry mi?
Evet. Altman o söylentiyi yayan kişiyi teselli etti.
Doğrudur muhtemelen. Sanırım sadece muhakemeye odaklandığını vurgulamak için yeni sürüm numarası olarak 1'i seçtiklerini söylüyor.