OpenAI, Model Spec'i yayımladı

(openai.com)

7 puan yazan xguru 2024-05-10 | Henüz yorum yok. | WhatsApp'ta paylaş

Sohbet tabanlı yapay zeka modellerinin nasıl çalışması gerektiğine dair kamuoyunun anlayışını artırmak için 'Model Spec' adlı bir belge yayımlandı

Model Spec, OpenAI API ve ChatGPT'de modellerin nasıl çalışmasının istendiğini belirten bir belge
İnsanların model davranışını oluşturan pratik tercihleri anlayıp tartışabilmesini sağlamanın önemli olduğu değerlendiriliyor
Model Spec, OpenAI'de kullanılan mevcut belgeleri, model davranışı tasarımına ilişkin araştırma ve deneyimleri ve gelecekteki model geliştirmelerine yönelik süren çalışmaları yansıtıyor
Bu, insan girdisini kullanarak model davranışını iyileştirmeye yönelik OpenAI'nin süregelen çabalarının bir uzantısı olup, collective alignment çalışmalarını ve daha geniş sistematik model güvenliği yaklaşımını tamamlıyor

İstenen model davranışını şekillendirmek (Shaping Desired Model Behavior)

Model davranışı, yani modelin kullanıcı girdisine nasıl yanıt verdiği (ton, kişilik, yanıt uzunluğu vb.), insanların yapay zeka yetenekleriyle nasıl etkileşim kurduğunda son derece önemlidir.

Model davranışını şekillendirmek hâlâ erken aşamadaki bir bilim dalı ve modeller açıkça programlanmak yerine geniş veri kümelerinden öğreniyor
Model davranışı şekillendirilirken çeşitli sorular, değerlendirmeler ve nüanslar dikkate alınmalı; çoğu zaman görüş ayrılıkları da tartılmalı
Modelin kullanıcılara geniş ölçüde yardımcı ve faydalı olması hedeflense bile, bu amaçlar pratikte birbiriyle çatışabilir
- Örnek: Bir güvenlik şirketi müşterilerini korumak için phishing e-posta sınıflandırıcısı eğitmeye yönelik sentetik veri üretmek isteyebilir; ancak dolandırıcılar da bu özelliği kullanırsa bu zararlı olur

Model Spec'e giriş

OpenAI, istenen model davranışının nasıl şekillendirileceğini ve çatışma durumunda ödünleşimlerin nasıl değerlendirileceğini açıklayan yeni bir belge olan 'Model Spec' taslağını paylaştı
Model Spec, şu anda OpenAI içinde kullanılan belgeleri, model davranışı tasarımına ilişkin deneyimleri ve süren araştırmaları, ayrıca uzman görüşleri gibi gelecekteki model geliştirmelerini yönlendiren güncel çalışmaları bir araya getiriyor
Model Spec'in eksiksiz olmadığı ve zaman içinde değişmesinin beklendiği belirtiliyor

Model Spec yaklaşımı şunları içeriyor:

Hedefler: İstenen davranış için yön veren geniş ve genel ilkeler
- Geliştiricileri ve son kullanıcıları desteklemek
- İnsanlığa fayda sağlamak
- OpenAI'yi iyi temsil etmek
Kurallar: Karmaşıklığı ele almaya ve güvenlik ile yasallığı sağlamaya yardımcı olan yönergeler
- Komut hiyerarşisine uymak
- İlgili yasalara uymak
- Bilgi tehlikesi oluşturacak içerik sağlamamak
- Üreticilere ve haklara saygı göstermek
- Gizliliği korumak
- NSFW içerikle yanıt vermemek
Reklam
Varsayılan davranışlar: Hedefler ve kurallarla uyumlu talimatlar; çatışmaların nasıl ele alınacağını gösterir ve hedeflerin nasıl önceliklendirileceğini ve dengeleneceğini örnekler
- Kullanıcının/geliştiricinin iyi niyetli olduğunu varsaymak
- Gerektiğinde netleştirici sorular sormak
- Aşırıya kaçmadan olabildiğince yardımcı olmak
- Sohbet tabanlı kullanım ile programlama kullanımının farklı gereksinimlerini desteklemek
- Nesnel bir bakış açısı benimsemek
- Adaleti ve nezaketi teşvik etmek, nefreti bastırmak
- Başkalarının fikrini değiştirmeye çalışmamak
- Belirsizliği ifade etmek
- Göreve uygun araçları kullanmak
- Uzunluk sınırlarına uyarken kapsamlı ve verimli olmak

Model Spec'in kullanım planı

OpenAI, collective alignment ve model güvenliği çalışmalarının bir uzantısı olarak Model Spec'i, insan geri bildiriminden pekiştirmeli öğrenme yapan araştırmacılar ve AI eğitmenleri için bir kılavuz olarak kullanmayı planlıyor
Ayrıca modellerin doğrudan Model Spec'ten ne ölçüde öğrenebileceğini de araştırmayı planlıyor

Gelecek planları

OpenAI, bu çalışmayı modellerin nasıl bir davranış sergilemesinin istendiği, istenen model davranışının nasıl belirleneceği ve genel kamuoyunun bu tartışmalara en iyi nasıl dahil edileceğine ilişkin süregelen kamusal diyaloğun bir parçası olarak görüyor
Diyalog sürdükçe, politika yapıcılar, güvenilir kurumlar ve alan uzmanları gibi küresel ölçekte temsili paydaşlarla iş birliği fırsatları aranacak
Bununla şu konuların anlaşılması hedefleniyor:
1. Paydaşların Model Spec yaklaşımını ve tek tek hedefleri, kuralları ve varsayılanları nasıl anladığı
2. Paydaşların bu yaklaşımı ve tek tek hedefleri, kuralları ve varsayılanları destekleyip desteklemediği
3. Ek olarak dikkate alınması gereken hedefler, kurallar veya varsayılanlar olup olmadığı
OpenAI, bu çalışma ilerledikçe paydaşların görüşlerini duymayı beklediğini belirtiyor
Ayrıca önümüzdeki 2 hafta boyunca genel kamuoyunun Model Spec'in hedefleri, kuralları ve varsayılanları hakkında geri bildirim paylaşması teşvik ediliyor
Bunun, misyona doğru sorumlu biçimde ilerlemek için geri bildirimi toplama ve entegre etmeye yönelik güçlü bir süreç geliştirmede erken içgörüler sağlaması umuluyor
Önümüzdeki 1 yıl boyunca OpenAI, Model Spec'teki değişiklikler, geri bildirimlere verilen yanıtlar ve model davranışını şekillendirmeye ilişkin araştırma ilerlemeleri hakkında güncellemeler paylaşmayı planlıyor