7 puan yazan xguru 2024-05-10 | Henüz yorum yok. | WhatsApp'ta paylaş

Sohbet tabanlı yapay zeka modellerinin nasıl çalışması gerektiğine dair kamuoyunun anlayışını artırmak için 'Model Spec' adlı bir belge yayımlandı

  • Model Spec, OpenAI API ve ChatGPT'de modellerin nasıl çalışmasının istendiğini belirten bir belge
  • İnsanların model davranışını oluşturan pratik tercihleri anlayıp tartışabilmesini sağlamanın önemli olduğu değerlendiriliyor
  • Model Spec, OpenAI'de kullanılan mevcut belgeleri, model davranışı tasarımına ilişkin araştırma ve deneyimleri ve gelecekteki model geliştirmelerine yönelik süren çalışmaları yansıtıyor
  • Bu, insan girdisini kullanarak model davranışını iyileştirmeye yönelik OpenAI'nin süregelen çabalarının bir uzantısı olup, collective alignment çalışmalarını ve daha geniş sistematik model güvenliği yaklaşımını tamamlıyor

İstenen model davranışını şekillendirmek (Shaping Desired Model Behavior)

Model davranışı, yani modelin kullanıcı girdisine nasıl yanıt verdiği (ton, kişilik, yanıt uzunluğu vb.), insanların yapay zeka yetenekleriyle nasıl etkileşim kurduğunda son derece önemlidir.

  • Model davranışını şekillendirmek hâlâ erken aşamadaki bir bilim dalı ve modeller açıkça programlanmak yerine geniş veri kümelerinden öğreniyor
  • Model davranışı şekillendirilirken çeşitli sorular, değerlendirmeler ve nüanslar dikkate alınmalı; çoğu zaman görüş ayrılıkları da tartılmalı
  • Modelin kullanıcılara geniş ölçüde yardımcı ve faydalı olması hedeflense bile, bu amaçlar pratikte birbiriyle çatışabilir
    • Örnek: Bir güvenlik şirketi müşterilerini korumak için phishing e-posta sınıflandırıcısı eğitmeye yönelik sentetik veri üretmek isteyebilir; ancak dolandırıcılar da bu özelliği kullanırsa bu zararlı olur

Model Spec'e giriş

  • OpenAI, istenen model davranışının nasıl şekillendirileceğini ve çatışma durumunda ödünleşimlerin nasıl değerlendirileceğini açıklayan yeni bir belge olan 'Model Spec' taslağını paylaştı
  • Model Spec, şu anda OpenAI içinde kullanılan belgeleri, model davranışı tasarımına ilişkin deneyimleri ve süren araştırmaları, ayrıca uzman görüşleri gibi gelecekteki model geliştirmelerini yönlendiren güncel çalışmaları bir araya getiriyor
  • Model Spec'in eksiksiz olmadığı ve zaman içinde değişmesinin beklendiği belirtiliyor

Model Spec yaklaşımı şunları içeriyor:

  1. Hedefler: İstenen davranış için yön veren geniş ve genel ilkeler
    • Geliştiricileri ve son kullanıcıları desteklemek
    • İnsanlığa fayda sağlamak
    • OpenAI'yi iyi temsil etmek
  2. Kurallar: Karmaşıklığı ele almaya ve güvenlik ile yasallığı sağlamaya yardımcı olan yönergeler
    • Komut hiyerarşisine uymak
    • İlgili yasalara uymak
    • Bilgi tehlikesi oluşturacak içerik sağlamamak
    • Üreticilere ve haklara saygı göstermek
    • Gizliliği korumak
    • NSFW içerikle yanıt vermemek
  3. Varsayılan davranışlar: Hedefler ve kurallarla uyumlu talimatlar; çatışmaların nasıl ele alınacağını gösterir ve hedeflerin nasıl önceliklendirileceğini ve dengeleneceğini örnekler
    • Kullanıcının/geliştiricinin iyi niyetli olduğunu varsaymak
    • Gerektiğinde netleştirici sorular sormak
    • Aşırıya kaçmadan olabildiğince yardımcı olmak
    • Sohbet tabanlı kullanım ile programlama kullanımının farklı gereksinimlerini desteklemek
    • Nesnel bir bakış açısı benimsemek
    • Adaleti ve nezaketi teşvik etmek, nefreti bastırmak
    • Başkalarının fikrini değiştirmeye çalışmamak
    • Belirsizliği ifade etmek
    • Göreve uygun araçları kullanmak
    • Uzunluk sınırlarına uyarken kapsamlı ve verimli olmak

Model Spec'in kullanım planı

  • OpenAI, collective alignment ve model güvenliği çalışmalarının bir uzantısı olarak Model Spec'i, insan geri bildiriminden pekiştirmeli öğrenme yapan araştırmacılar ve AI eğitmenleri için bir kılavuz olarak kullanmayı planlıyor
  • Ayrıca modellerin doğrudan Model Spec'ten ne ölçüde öğrenebileceğini de araştırmayı planlıyor

Gelecek planları

  • OpenAI, bu çalışmayı modellerin nasıl bir davranış sergilemesinin istendiği, istenen model davranışının nasıl belirleneceği ve genel kamuoyunun bu tartışmalara en iyi nasıl dahil edileceğine ilişkin süregelen kamusal diyaloğun bir parçası olarak görüyor
  • Diyalog sürdükçe, politika yapıcılar, güvenilir kurumlar ve alan uzmanları gibi küresel ölçekte temsili paydaşlarla iş birliği fırsatları aranacak
  • Bununla şu konuların anlaşılması hedefleniyor:
    1. Paydaşların Model Spec yaklaşımını ve tek tek hedefleri, kuralları ve varsayılanları nasıl anladığı
    2. Paydaşların bu yaklaşımı ve tek tek hedefleri, kuralları ve varsayılanları destekleyip desteklemediği
    3. Ek olarak dikkate alınması gereken hedefler, kurallar veya varsayılanlar olup olmadığı
  • OpenAI, bu çalışma ilerledikçe paydaşların görüşlerini duymayı beklediğini belirtiyor
  • Ayrıca önümüzdeki 2 hafta boyunca genel kamuoyunun Model Spec'in hedefleri, kuralları ve varsayılanları hakkında geri bildirim paylaşması teşvik ediliyor
  • Bunun, misyona doğru sorumlu biçimde ilerlemek için geri bildirimi toplama ve entegre etmeye yönelik güçlü bir süreç geliştirmede erken içgörüler sağlaması umuluyor
  • Önümüzdeki 1 yıl boyunca OpenAI, Model Spec'teki değişiklikler, geri bildirimlere verilen yanıtlar ve model davranışını şekillendirmeye ilişkin araştırma ilerlemeleri hakkında güncellemeler paylaşmayı planlıyor

Henüz yorum yok.

Henüz yorum yok.