- OpenAI, Financial Times'a yaptığı açıklamada Çinli yapay zeka girişimi DeepSeek'in, açık kaynaklı rakip bir modeli eğitmek için kendi özel modellerini kullandığına dair kanıt bulduğunu söyledi
- DeepSeek'in, büyük modellerin çıktılarından yararlanarak daha küçük bir modeli verimli biçimde eğiten "bilgi damıtma (distillation)" tekniğini kullanmış olabileceğinden şüpheleniliyor
- Damıtma, yapay zeka sektöründe yaygın bir yöntem olsa da OpenAI, DeepSeek'in bunu kullanarak kendi bağımsız modelini geliştirmesinin hizmet şartlarını ihlal ettiğini savunuyor
- OpenAI şartlarına göre kullanıcılar OpenAI çıktısını kopyalayamaz veya bunu rakip modeller geliştirmek için kullanamaz
DeepSeek'in model performansı ve piyasa tepkisi
- DeepSeek'in R1 muhakeme modelinin yayımlanması teknoloji sektörü ve yatırımcıları şaşırttı
- DeepSeek, görece düşük maliyetle yüksek performans sunan modeller geliştirerek sektörün dikkatini çekiyor
- Nvidia hisseleri pazartesi günü %17 düşerek 589 milyar dolarlık piyasa değerini sildi, ancak salı günü %9 toparlandı
- Nvidia'daki düşüşün nedeni, yapay zeka donanımına yönelik talebin azalabileceği endişesi
OpenAI ve Microsoft'un yanıtı
- OpenAI ve Microsoft, geçen yıl DeepSeek'in OpenAI API'sini kullanarak damıtma yapmaya çalıştığından şüphelenilen hesapları soruşturdu ve engelledi
- Konuyla ilgili ilk haber Bloomberg'de çıktı
- Microsoft bu konuda yorum yapmaktan kaçındı, OpenAI de ek açıklama yapmayı reddetti
Uzman görüşleri
- Trump yönetiminin eski yapay zeka ve kripto sorumlusu David Sacks, "IP hırsızlığı olmuş olabilir" dedi
- Bazı yapay zeka araştırmacıları, DeepSeek'in modelinde GPT-4 çıktılarıyla eğitildiğine işaret eden izler görüldüğünü değerlendiriyor
- UC Berkeley'de yapay zeka alanında doktora araştırmacısı olan Ritwik Gupta, ticari LLM çıktılarıyla model eğitmenin yapay zeka sektöründe yaygın bir pratik olduğunu açıkladı
OpenAI'nin tutumu ve bundan sonrası
- OpenAI, Çin dahil çeşitli şirketlerin ABD'li yapay zeka şirketlerinin modellerini damıtmaya çalıştığı konusunda uyardı
- Fikri mülkiyeti korumak için modellerin en ileri yeteneklerini ne ölçüde açıklayacağına dikkatle karar verdiğini ve teknoloji sızıntısını önlemek için ABD hükümetiyle iş birliğinin önemli olduğunu vurguladı
- Ancak OpenAI de New York Times başta olmak üzere medya kuruluşları ve telif hakkı sahipleri tarafından izinsiz veri kullanımı iddiasıyla dava edilmesi gibi kendi telif hakkı tartışmalarıyla karşı karşıya
2 yorum
OpenAI, New York Times ile dava sürecinde; bu durumda DeepSeek o davadan muaf mı oluyor? :)
Hacker News görüşleri
DeepSeek'in OpenAI verilerini kullanarak eğitim yaptığı iddiasının haksız olduğuna dair görüşler var; buna karşılık OpenAI'nin de internetten veri toplayarak eğitim yaptığı düşünüldüğünde bu iddianın uygunsuz olduğu söyleniyor
DeepSeek'in açık kaynak ve MIT lisansı ile yayımlanmasının büyük yetenekleri çekmek için bir fırsat olacağı görüşü
r1, o1 sonrasındaki dünyada ortaya çıktı ve diğer modellerin r1'i distill edebileceği bir ortam var
Eğer DeepSeek OpenAI'den eğitim aldıysa, bu "pennies on the dollar" maliyetiyle sıfırdan eğitilmiş olduğu anlamına gelmez ve teknik bir atılım olmayabilir
OpenAI şu anda zayıf bir konumda ve Google ya da Microsoft gibi hukuki kaynaklarını kullanabilecek durumda değil
Demiryolu sektörüne benzer şekilde yapay zekada da rekabet maliyetleri düşürebilir ve yatırımların çoğu büyük servet üretmeyebilir
OpenAI'nin içeriği izinsiz kullanmasına ve yapay zeka bağımlılığı yaratan script'leri aşmak için büyük harcamalar yapmasına yönelik eleştiriler
OpenAI'nin modelleri, kişisel e-kitap torrent tracker'larından büyük ölçekte toplanan e-kitaplar temel alınarak eğitildi