OpenAI, DeepSeek'in kendi modellerini eğitimde kullandığına dair kanıt bulduğunu açıkladı

(ft.com)

5 puan yazan GN⁺ 2025-01-30 | 2 yorum | WhatsApp'ta paylaş

OpenAI, Financial Times'a yaptığı açıklamada Çinli yapay zeka girişimi DeepSeek'in, açık kaynaklı rakip bir modeli eğitmek için kendi özel modellerini kullandığına dair kanıt bulduğunu söyledi
DeepSeek'in, büyük modellerin çıktılarından yararlanarak daha küçük bir modeli verimli biçimde eğiten "bilgi damıtma (distillation)" tekniğini kullanmış olabileceğinden şüpheleniliyor
Damıtma, yapay zeka sektöründe yaygın bir yöntem olsa da OpenAI, DeepSeek'in bunu kullanarak kendi bağımsız modelini geliştirmesinin hizmet şartlarını ihlal ettiğini savunuyor
OpenAI şartlarına göre kullanıcılar OpenAI çıktısını kopyalayamaz veya bunu rakip modeller geliştirmek için kullanamaz

DeepSeek'in model performansı ve piyasa tepkisi

DeepSeek'in R1 muhakeme modelinin yayımlanması teknoloji sektörü ve yatırımcıları şaşırttı
DeepSeek, görece düşük maliyetle yüksek performans sunan modeller geliştirerek sektörün dikkatini çekiyor
Nvidia hisseleri pazartesi günü %17 düşerek 589 milyar dolarlık piyasa değerini sildi, ancak salı günü %9 toparlandı
Nvidia'daki düşüşün nedeni, yapay zeka donanımına yönelik talebin azalabileceği endişesi

OpenAI ve Microsoft'un yanıtı

OpenAI ve Microsoft, geçen yıl DeepSeek'in OpenAI API'sini kullanarak damıtma yapmaya çalıştığından şüphelenilen hesapları soruşturdu ve engelledi
Konuyla ilgili ilk haber Bloomberg'de çıktı
Microsoft bu konuda yorum yapmaktan kaçındı, OpenAI de ek açıklama yapmayı reddetti

Uzman görüşleri

Trump yönetiminin eski yapay zeka ve kripto sorumlusu David Sacks, "IP hırsızlığı olmuş olabilir" dedi
Bazı yapay zeka araştırmacıları, DeepSeek'in modelinde GPT-4 çıktılarıyla eğitildiğine işaret eden izler görüldüğünü değerlendiriyor
UC Berkeley'de yapay zeka alanında doktora araştırmacısı olan Ritwik Gupta, ticari LLM çıktılarıyla model eğitmenin yapay zeka sektöründe yaygın bir pratik olduğunu açıkladı

OpenAI'nin tutumu ve bundan sonrası

OpenAI, Çin dahil çeşitli şirketlerin ABD'li yapay zeka şirketlerinin modellerini damıtmaya çalıştığı konusunda uyardı
Fikri mülkiyeti korumak için modellerin en ileri yeteneklerini ne ölçüde açıklayacağına dikkatle karar verdiğini ve teknoloji sızıntısını önlemek için ABD hükümetiyle iş birliğinin önemli olduğunu vurguladı
Ancak OpenAI de New York Times başta olmak üzere medya kuruluşları ve telif hakkı sahipleri tarafından izinsiz veri kullanımı iddiasıyla dava edilmesi gibi kendi telif hakkı tartışmalarıyla karşı karşıya

2 yorum

botplaysdice 2025-02-01

OpenAI, New York Times ile dava sürecinde; bu durumda DeepSeek o davadan muaf mı oluyor? :)

GN⁺ 2025-01-30

Hacker News görüşleri

DeepSeek'in OpenAI verilerini kullanarak eğitim yaptığı iddiasının haksız olduğuna dair görüşler var; buna karşılık OpenAI'nin de internetten veri toplayarak eğitim yaptığı düşünüldüğünde bu iddianın uygunsuz olduğu söyleniyor
- DeepSeek'in o1 seviyesindeki performansı sıfırdan yeniden ürettiğini iddia etmesi gerçeği yansıtmayabilir; bu da eğitim verimliliği konusunda soru işaretleri doğuruyor
- DeepSeek'in R1 makalesi, distillation'ın çok güçlü olduğunu gösteriyor; eğer DeepSeek modeli eğitmek için o1 çıktısını kullandıysa bu, eğitim verimliliğiyle ilgili soru işaretleri yaratabilir
DeepSeek'in açık kaynak ve MIT lisansı ile yayımlanmasının büyük yetenekleri çekmek için bir fırsat olacağı görüşü
- Yeni teknolojilerin açık kaynak hâline gelmesi geçmişte de her zaman ilerlemeyi hızlandırdı
- OpenAI, IP koruması için ABD hükümetiyle iş birliği yapıyor ve DeepSeek'in TikTok gibi yasaklanma ihtimali de var
r1, o1 sonrasındaki dünyada ortaya çıktı ve diğer modellerin r1'i distill edebileceği bir ortam var
- o1'den distill etmenin DeepSeek'in maliyet iddiasını zayıflatmadığı görüşü
- OpenAI'nin ahlaki ya da etik bir üstünlüğe sahip olup olmadığı sorgulanıyor
Eğer DeepSeek OpenAI'den eğitim aldıysa, bu "pennies on the dollar" maliyetiyle sıfırdan eğitilmiş olduğu anlamına gelmez ve teknik bir atılım olmayabilir
- Bunun doğru olup olmadığı henüz doğrulanmış değil
OpenAI şu anda zayıf bir konumda ve Google ya da Microsoft gibi hukuki kaynaklarını kullanabilecek durumda değil
- OpenAI'nin rakiplerini hukuki sorunlarla bastırma stratejisinin etkili olmayacağı görüşü
Demiryolu sektörüne benzer şekilde yapay zekada da rekabet maliyetleri düşürebilir ve yatırımların çoğu büyük servet üretmeyebilir
- Nvidia, OpenAI, DeepSeek gibi büyük şirketler yapay zekaya yatırım yapıyor, ancak somut kâr üretmeyi başaramayabilirler
OpenAI'nin içeriği izinsiz kullanmasına ve yapay zeka bağımlılığı yaratan script'leri aşmak için büyük harcamalar yapmasına yönelik eleştiriler
- Eğer DeepSeek OpenAI verilerini yeniden kullandıysa bunun mühendislikte bir atılım olmadığı görüşü
OpenAI'nin modelleri, kişisel e-kitap torrent tracker'larından büyük ölçekte toplanan e-kitaplar temel alınarak eğitildi
- E-kitaplar epub formatına dönüştürülüp düzenlendi ve herkese açık veri depolarında barındırıldı

OpenAI, DeepSeek'in kendi modellerini eğitimde kullandığına dair kanıt bulduğunu açıkladı

DeepSeek'in model performansı ve piyasa tepkisi

OpenAI ve Microsoft'un yanıtı

Uzman görüşleri

OpenAI'nin tutumu ve bundan sonrası

İlgili okumalar

2 yorum

Hacker News görüşleri