Greg Brockman röportajı: Yapay zeka yakında patlayıcı biçimde büyüyecek! Bundan sonra neler olacak?
(fs.blog)- Greg Brockman, OpenAI’nin AGI misyonuna ulaşabilmesi için kâr amacı gütmeyen yapının sınırlarını aşarak kâr amaçlı bir şirket ve büyük ölçekli compute kapasitesi edinmesi gerektiğini düşünüyor
- OpenAI’nin teknolojik dönüm noktaları, Dota’daki PPO ölçeklendirmesi, dil modellerinin anlam öğrenmesi ve GPT-4 sonrasında AGI ölçütünün yeniden değerlendirilmesine uzanıyor
- Yapay zeka geliştirme zaten yapay zeka tarafından hızlandırılıyor; kod yazımı hızla ikame edilirken kod yapısının tasarımı konusunda insan uzmanların hâlâ güçlü olduğu düşünülüyor
- Bundan sonra temel kısıt compute olacak; OpenAI, veri merkezleri ve ücretsiz erişim yoluyla teknolojinin faydalarını geniş kitlelere dağıtmayı amaçlıyor
- Yinelemeli dağıtım, güvenlik, tarafsızlık ve regülasyonun tamamı hem ürün hem de toplum açısından temel meseleler; başarı ölçütü ise AGI’nin tüm insanlığa fayda sağlaması
OpenAI’nin kuruluşu ve yapısal dönüşümü
-
Stripe sonrası neden yapay zekaya geçti?
- Greg Brockman, Stripe’ta çözdüğü problemlerin ömür boyu peşinden gitmek isteyeceği türden olmadığını ve eğer yapay zekanın dünyada nasıl geliştiği üzerinde etkisi olabilirse bunun anlamlı bir hayat olacağına karar verdi
- Patrick Collison, Brockman Stripe’tan ayrılmayı düşünürken ona Sam Altman’la konuşmasını önerdi; Sam ise birkaç dakika içinde Brockman’ın zaten ayrılmaya karar verdiğini düşündü
- Brockman bir yapay zeka şirketi düşündüğünü söyleyince Sam de yapay zeka alanında bir şeyler başlatmak istediğini söyledi ve irtibatta kalmayı önerdi; bu da 2015’te bir araştırma laboratuvarı kurma tartışmalarına uzandı
-
2015’te laboratuvarın kuruluşu ve ilk ekip
- O dönemde DeepMind, araştırmacıları, sermayesi, verisi ve geçmiş başarılarıyla “10.000 kiloluk goril” gibi görünüyordu; AlphaGo açıklanmadan önce bile ivmesi açıktı
- Temel soru, “En iyi araştırmacıların çoğunu toplayıp bir laboratuvar kurmak için artık çok mu geç, bu mümkün mü?” idi; zor olduğuna dair pek çok neden vardı ama imkânsız olduğuna dair bir sonuca varılmadı
- Sam Altman ve Brockman, “Bunu yapmalıyız” sonucuna vardı ve Brockman ertesi gün tam zamanlı olarak organizasyonu kurmaya başladı
- İlk taslakta Ilya Sutskever, Dario Amodei, Chris, Greg Brockman yer alıyordu ama bu tam olarak gerçekleşmedi; Chris Google Brain’e geçti, John Schulman ve başkaları da ilgi gösterdi
- Yaklaşık 10 kişi “Kimler bizimle olacak?” diye sorarken Sam bir offsite önerdi; resmi teklif, organizasyon yapısı ya da katılımı kesinleşmiş isimler olmadan insanları Napa’da topladılar
- Napa offsite’ında, sonraki 10 yıla uzanan teknik plana yakın bir yön ortaya çıktı; özünde pekiştirmeli öğrenmeyi çözmek, gözetimsiz öğrenmeyi çözmek ve giderek daha karmaşık hedefleri aşamalı olarak öğrenen bir strateji vardı
-
Kâr amacı gütmeyen yapının sınırları ve kâr amaçlı şirket
- 2017’de OpenAI, AGI’yi gerçekten inşa etmek için gereken koşulları ve compute ölçeğini hesaplamaya başladı; sonuç, çok büyük bilgisayarların gerekeceği yönündeydi
- Cerebras’ın geliştirdiği özgün bilişim donanımının, hesaplamalara göre gereken seviyenin çok ötesine geçebileceğini düşündüler; tekel niteliğinde erişim ya da büyük veri merkezleri edinmenin AGI geliştirmede büyük avantaj sağlayacağına kanaat getirdiler
- Kâr amacı gütmeyen bağış toplamanın bir üst sınırı olduğunu düşündüler; Elon Musk, Sam Altman, Ilya Sutskever ve Greg Brockman, OpenAI misyonuna ulaşmanın tek yolunun OpenAI ile bağlantılı kâr amaçlı bir şirket kurmak olduğu konusunda mutabık kaldı
- AGI’yi yapmak için sermaye gerekiyor ama yalnızca kâr amacı gütmeyen bir yapıyla 100 milyon ya da 500 milyon dolar mümkün olsa da 1 milyar doların çok zor olacağı düşünülüyordu
-
İç gerilimler ve Sam Altman’ın görevden alınması
- İnsan düzeyinde zekâya sahip makineler yapılabileceğine inanan bir organizasyonda, karar vericiler, kararlara giren değerler ve katkının nasıl paylaştırıldığı gibi sıradan şirket içi siyasetler bile varoluşsal bir ağırlık kazanıyor
- Brockman, görüntülü aramada Sam hariç yönetim kurulunun toplandığını gördü ve kurulun Sam Altman’ı görevden alma kararı verdiği kendisine bildirildi
- Ek bilgi istedi ama paylaşacak başka bir şey olmadığı cevabını aldı; kendisinin de yönetim kurulundan çıkarılacağı fakat şirkette kalmasının ve misyonu sürdürmesinin önemli olduğu söylendi
- Gerekçe ya da geri bildirim alamayan Brockman, görüşmeden hemen sonra eşiyle konuştuktan sonra istifa etmesi gerektiği sonucuna vardı
- İstifa günü, Sam ve Brockman bundan sonra ne yaparsa yapsın birlikte olacaklarına dair mesajlar yağdı; yakın çalışma arkadaşları da o gün birlikte istifa etti
- Sam’in de aralarında olduğu beş kişi yeni bir şirket fikri üzerinde çalışmaya başladı ve Brockman şirketi geri alma ihtimalini %10 olarak görüyordu
- Pazar gecesi kurul, geçici CEO Mira’yı yeni biriyle değiştirince şirkette tepki büyüdü; yalnızca beklenen katılımcıları alacak küçük bir “cankurtaran sandal” planı, neredeyse herkesi kabul etmek zorunda kalacak kadar genişledi
- Şükran Günü öncesinde bile birçok çalışan memlekete dönüş uçuşunu iptal edip ofiste toplandı; dilekçe belgesinde aynı anda çok fazla kişinin imza atmaya çalışması nedeniyle Google Dokümanlar kilitlendi
- Brockman sabaha karşı Twitter’ı kontrol etti ve Ilya’nın dilekçeyi imzalayıp şirketin yeniden birleşmesini istediğini yazdığını görünce büyük rahatlama hissetti
-
Ilya Sutskever ile ilişkinin onarılması ve liderlik dersleri
- Ilya, Brockman’ın medeni nikâhında nikâh memurluğunu üstlenecek kadar yakın biriydi ve ikili zorlu dönemlerden birlikte geçti
- Sonrasında ikisi de birikmiş ya da hiç söylenmemiş şeyleri anlamak ve ifade etmek için çok zaman harcadı; Brockman bu süreç sayesinde bir kapanış duygusuna ulaştığını hissetti
- Olaylardan sonra rakip şirketler insanları transfer etmeye çalıştı ve daha fazla para ya da daha iyi teklifler sunulmuş olabilir, ancak o hafta sonu OpenAI tek bir kişiyi bile kaybetmedi ve kimse rakip teklifleri kabul etmedi
- Ilya ayrıldığında bu, OpenAI tarihinde neredeyse ilk kez artık devam etmek istemediğini hissettiği andı; bu işin neden önemli olduğunu ve çekilen acıya neden değdiğini yeniden bulması gerekti
- Mola döneminde DNA dizileri üzerinde dil modeli eğitti; eşiyle birlikte hayvanların sağlık sorunlarında yapay zekanın ne yapabileceğine ilgi duyarak teknolojiyi kendisi için anlamlı alanlara uyguladı
- Geriye dönüp baktığında, yaptığı hatalar çoğunlukla yapılması gerektiğini bildiği kararları fazla uzun süre ertelemekten ibaretti; tekrar tekrar öğrendiği ders ise zor kararları ver ve zor konuşmaları yap oldu
Teknik dönüm noktaları ve yapay zeka geliştirmesinin hızlanması
-
Art arda gelen “bu gerçek” anları
- OpenAI’nin ilerlemesi, tek bir aydınlanma anından çok, art arda gelen “bu gerçek” hissi uyandıran anlardan oluşan bir süreçti
- İlk kuruluş, ekibi toplayıp misyonun peşinden gidilebilen andı; ancak ertesi gün ofiste ne yapılacağının, hatta ortada bir beyaz tahtanın bile olmadığı bir durum vardı
-
Dota ve PPO’nun gösterdiği ölçeklenebilirlik
- Dota ilk büyük başarıydı ve compute arttıkça sonucun da büyüdüğünü gösterdi
- Aslında Dota projesi, mevcut reinforcement learning yöntemlerinin ölçeklenmeyeceği varsayımıyla yeni bir yöntem geliştirme girişimiydi ve kullanılan algoritma PPO idi
- PPO, tüm zaman adımlarını planlıyor ve hiyerarşik bir yapıya sahip olmaması nedeniyle insanların günü planlama biçiminden farklıydı; çok kusurlu olduğu ve ölçeklenmeyeceği düşünülse de, temel çizgiyi sınırlarına kadar zorlamaya karar verildi
- PPO sürekli ölçeklendirildikçe en iyi insan oyuncuların performansını aştı ve bu da basit algoritmalar ile büyük ölçekli compute’un gerçek dünyada da işe yaradığının keşfine yol açtı
- Dota ortamı; programlamanın, ileriye dönük plan yapmanın ya da arama kullanmanın zor olduğu karmaşık bir ortamdı ve neredeyse insan benzeri sezgi gerektiriyordu
- Kullanılan sinir ağı, sinaps sayısı bakımından “küçük bir böcek beynine” daha yakındı; bu da aynı hesaplama yaklaşımı insan beyni ölçeğine daha yakın bir seviyeye çıkarılırsa ne olacağı sorusunu geride bıraktı
-
Dil modelleri, anlam öğrenimi ve GPT-4 sonrası değişen ölçütler
- 2017 tarihli unsupervised sentiment neuron makalesi, dil modelleme hedefinden anlambilimin ortaya çıktığının ilk kez görüldüğü an olarak anılıyor
- Sadece bir sonraki karakteri tahmin edecek şekilde eğitilmiş olmasına rağmen sinir ağı, cümlenin olumlu mu olumsuz mu olduğunu anlamayı başardı; bu da sadece virgül, isim ve fiil konumlarını değil, cümlenin anlamını da öğrenebildiğini gösterdi
- GPT-4 üzerinde çalışılırken “Bu neden AGI değil?” sorusu gündeme geldi; istenen konuda akıcı şekilde konuşabiliyordu ama açıkça eksik kalan bir şey vardı
- GPT-4’ün yayımlanmasından 2 ay önce sahip olunan AGI ölçütlerinin, GPT-4’ün gerçek yetenekleriyle uyuşmuyor olabileceği ve bundan sonra da bir sonraki aşamayı mümkün kılacak atılım anlarının hâlâ bulunduğu düşünülüyordu
-
Tahmin, gözetimsiz öğrenme ve reinforcement learning arasındaki bağlantı
- Bir sonraki kelimeyi tahmin etmek sıradan görünebilir; ancak Einstein’ın bir sonraki sözünü gerçekten tahmin edebiliyorsanız, en az Einstein kadar zeki olmanız gerekir görüşü öne çıkıyor
- Tahminin özü, zaten bilinen şeyi tutturmak değil, daha önce hiç görülmemiş yeni bir durumda sırada ne geleceğini tahmin edebilmekte yatıyor
- Model eğitimi, statik ve gözlemsel veriden sonra ne geleceğini tahmin etmeyi öğrenen gözetimsiz öğrenme ile, yapay zekanın kendi eylemlerini seçip dünyanın gözlemlerini alarak kendi verisinden öğrendiği reinforcement learning olarak ayrılıyor
- İki aşamada kullanılan teknikler temelde aynı; değişen şey ise veri yapısı
-
Yapay zekanın yapay zeka geliştirmesini hızlandırdığı aşama
- Yapay zeka kendi geliştirme sürecine uygulanmaya başladıkça, geliştirme hızının giderek arttığı bir aşamaya girildiği düşünülüyor
- ChatGPT’den sonra iç geliştirme süreçleri %10~20 hızlandı ve son dönemdeki kodlama araçları, software engineering yapma biçimini büyük ölçüde değiştirdi
- Model üretimindeki darboğazların büyük kısmı; sistem uygulaması, ölçek büyütme ve büyük bilgisayarların yönetimi gibi yazılım tarafında bulunuyor
- Yakında yapay zekanın kendi araştırma fikirlerini ürettiği, deneyler yürüttüğü ve test ettiği aşamaya ulaşılacağı öngörülüyor
- Şu anda kod yazımında yapay zekanın yazmadığı kısmın oranını bilmek zor ve bunun “yok denecek kadar az” olduğu; doğru bağlam ve yapı verildiğinde fiilî kod yazımında yapay zekanın insandan daha iyi olduğu düşünülüyor
- Buna karşılık modül yerleşimi, bileşenler arası ilişkiler ve belirli arayüzlerin tanımlanması gibi kod yapısı tasarımında insan uzmanların hâlâ çok daha iyi olduğu belirtiliyor
-
Yeni fikirler ve chain of thought’un gizli tutulması
- Yapay zekanın insanların düşünemediği yeni fikirler ortaya koyduğu aşamaya yaklaşıldığı düşünülüyor
- 2024’te şirket içi çip tasarımında devre alanını küçültmek için OpenAI teknolojisi uygulandı; modelin ürettiği optimizasyon, insanların listesinde zaten vardı ama zaman yokluğu nedeniyle yapılamayan şeyi daha hızlı hayata geçirdi
- Matematik ve fizikte açık matematik problemleri ile açık fizik problemleri çözülüyor; yakın zamanda kuantum fiziğindeki belirli bir sorunun, topluluğun beklentisinin ters yönünde çözülüp zarif bir formül de ortaya konduğu belirtiliyor
- OpenAI, özellikle chain of thought gibi kullanıcıya sonuç vermek için zorunlu olmayan ama modelin bir parçası olan unsurları koruyarak, damıtmayı zorlaştırmaya çalışıyor
- OpenAI’nin temel üstünlüğü, belirli bir modelin kendisinde değil, model üreten makinede yatıyor
- Reasoning’in gösterilmemesinin nedenlerinden biri damıtmayı önlemek, daha önemli nedenlerden biri ise yorumlanabilirlik
- Chain of thought görsel olarak hoş görünsün diye eğitildiğinde sadakat ortadan kalkıyor ve model gerçek neden yerine kullanıcının görmek istediği biçimde reasoning üretebiliyor
- OpenAI, chain of thought’u kullanıcıya gösterilmeye uygun bir biçimde eğitme cazibesinden kaçınmayı erken dönemde kararlaştırdı ve rekabet ile güvenlik gerekçeleriyle ara düşünme adımlarını açıklamama yönüne kaydı
Hesaplama kısıtı, veri merkezleri, ürün odağı
-
Hesaplamanın temel kısıt haline geldiği dünya
- Bundan sonra genel olarak hesaplama kısıtlı bir dünyaya gidildiği düşünülüyor
- Modellerin ürettiği değer, basit soru-cevabın ötesine geçerek sağlık bilgilerine erişim, birden fazla veri kaynağını birleştirme, kurumsal bilgi tabanlarında arama, zor problemleri çözme ve insanlardan daha iyi yazılım yazmaya kadar genişliyor
- GPT-5'ten 5.1, 5.2 Codex, 5.3, 5.4'e uzanan ilerleme çok büyüktü ve modellerin kullanıcının niyetini anlama ve hedefe uyum sağlama becerisi büyük ölçüde gelişti
- Codex gibi bir yüzeye model yerleştirildiğinde geliştiriciler eskisinden çok daha fazlasını başarabiliyor
- Dünyadaki herkese birer GPU vermeye kalksanız bile 8 milyar GPU gerekir, ancak mevcut gidişat bu seviyeye yaklaşmıyor
- Bugün yüz binlerce GPU büyük ölçektir; ileride milyonlarca GPU gelebilir, ancak dünyada hâlâ çok az hesaplama gücü var ve bu teknolojiyi herkese ulaştırmak için çok daha fazlası gerekiyor
-
Veri merkezi stratejisi ve fiziksel altyapı
- OpenAI, gelecekte olacakları öngörerek hesaplama altyapısı kurmaya büyük çaba harcadı ve modelleri herkese geniş ölçekte sunma misyonuna odaklanmak istiyor
- Veri merkezlerine çok fazla emek ve para yatırma stratejisi rakipler tarafından alaya alınmıştı, ancak artık bunun yalnızca iş açısından değil, teknolojiyi herkese ulaştırma misyonunu yerine getirmede de avantaj sağlayacağı düşünülüyor
- Yapay zeka için veri merkezleri, “insanlığın yaptığı en büyük makinelere” yakındır; amaçları da kanseri tedavi etme, işletmeleri yürütme ve günlük sorgular gibi insanlar için önemli sorunları çözmek ve hedeflere ulaşmaya yardımcı olmaktır
- Belirli bir probleme adanmış veri merkezleri konusunda, örneğin Dakota'daki dev bir veri merkezinin yalnızca kanseri çözmeye odaklanması gibi bir yapının bu yıl gerçekleşmesi de ihtimal dışı görülmüyor
- Mevcut veri merkezleri çok hassas büyük makinelerdir ve geçmişte kabloların aşırı gergin olması nedeniyle sinyal bütünlüğü sorunları yaşanıp bilgisayarların çalışmadığı durumlar da olmuştu
- Şu anda sistem bakımı insanlar tarafından fiziksel olarak yapılıyor, ancak gelecekte bunun robotiğe kayma ihtimali var
- Uzaydaki veri merkezlerinin çok sayıda teknik sorunu var, ancak hesaplama talebi o kadar büyük ki tüm seçeneklerin düşünülmesi gerektiği belirtiliyor
-
Hesaplama dağıtımı ve erişilebilirlik
- Hesaplamanın sınırlı olduğu bir durumda, “görüntü üretimi” ile “kanseri çözme” gibi farklı talepler arasında hesaplamanın nereye tahsis edileceği toplumsal açıdan önemli bir soru haline geliyor
- OpenAI, herkesin hesaplama gücüne erişmesi gerektiğini düşünüyor; ChatGPT'de ücretsiz katman bulunmasının nedeni de teknolojinin yaygın kullanılmasını, insanların bunu doğrudan anlayıp kullanım biçimlerini şekillendirmesini sağlamak
- Sorunları önce “fildişi kule” tarzında çözüp ardından sonuçları dağıtma yaklaşımının da avantajları var, ancak OpenAI'nin ağırlık merkezi teknolojinin faydalarını geniş ölçekte dağıtma yönünde
-
Kurumsal ve tüketici tarafının birleşmesi
- OpenAI'nin bir sonraki aşamasında kurumsal taraf çok önemli ve ekonomi gözlerimizin önünde hesaplama temelli bir ekonomiye dönüşüyor
- Yazılım mühendisliğinde değişim zaten görünmeye başladı; bilgisayarla çalışılan tüm alanlarda “insanın bilgisayarla çalışması” modelinden bilgisayarın insan için çalıştığı modele geçileceği düşünülüyor
- Kurumsal ve tüketici tarafı arasındaki sınır bulanıklaşabilir ve girişim kurmanın çok daha kolaylaştığı bir değişim şimdiden görülüyor
- Bir arkadaşı, kız kardeşinin istediği uygulamayı dinlerken bunu Codex'e girdi; birkaç saat sonra uygulamayı gösterdiğinde kız kardeşi “Bunu kim yaptı?” diye sordu, o da “Sen yaptın” diye yanıt verdi
- Codex, yalnızca yazılım mühendisleri için bir araç değil; vizyonu ve uygulama isteği olan herkesin üretici olabilmesini sağlayan bir araç olarak sunuluyor
-
Kişisel yapay zeka ve tek bir teknoloji sistemi
- OpenAI'nin özellikle odaklandığı tüketici alanı, eğlence ya da kendini ifade etmeden çok hedef çözümü
- Eğer akıllı telefon kullanıcısı yaklaşık 4 milyar ise, herkesin kendisini iyi tanıyan, kişisel bağlamını anlayan, güvenilir olan ve kendisinden tavsiye alınabilecek bir kişisel yapay zekâya veya kişisel AGI'ye sahip olması gerektiği düşünülüyor
- Kişisel yapay zeka, sevilen bir müzisyen şehre geldiğinde bilet almak gibi proaktif davranabilir; bazı durumlarda önce onay isteyebilir, bazı durumlarda ise önceden verilmiş izin doğrultusunda doğrudan harekete geçebilir
- Hedefleri yine kullanıcının belirlemesi ve kontrolün kullanıcıda olması gerektiği varsayımı korunuyor
- Kişisel yapay zeka ya da kişisel AGI'ye erişmesi gereken kişi sayısının 4 milyarı aşarak 8 milyara, yani tüm dünyaya ulaşacağı düşünülüyor
- İster işte ister kişisel yaşamda kullanılsın, birden fazla örnek olabilir ama temel olarak bunun tek bir teknoloji sistemi olduğu düşünülüyor
Dağıtım, güvenlik, tarafsızlık, düzenleme
-
Yinelemeli dağıtım
- Yinelemeli dağıtım (iterative deployment), OpenAI'nin teknolojiyi insanlar için faydalı hale getirmek ve misyonunu gerçekleştirmek için kullandığı temel sütunlardan biridir
- AGI'yi gizlice geliştirip hiçbir şey dağıtmadan bir noktada düğmeye basarak dağıtmak da bir yol olabilir, ancak bu durumda güçlü sistemlerle gerçek dünyanın ilk temasını tek seferde yönetmek gerekir
- Buna karşılık giderek güçlenen sistemleri defalarca dağıtmak, "100. sistem" ile uğraşılan bir duruma götürür; önceki 99 sorunun çözümünden öğrenilebilir ve dünya da uyum sağlamak için zaman kazanır
- GPT-3 dağıtılmadan önce yanlış bilgi gibi büyük çerçeveli sorunlar çok düşünülmüştü, ancak gerçekte en büyük kötüye kullanım insanların karşısına çeşitli ilaçlar çıkaran tıbbi spam oldu
- Yinelemeli dağıtım, ara sürümleri dünyaya sunup gerçek kötüye kullanımları ve riskleri görerek öğrenme yöntemidir; bu, kontrolsüzce dağıtalım anlamına gelmez
- AI gibi hızla dağıtılan ve güçlü teknolojiler için bir playbook yoktur ve OpenAI de bunu yaparken öğrenmek zorundadır
-
Güvenlik bir ürün özelliğidir
- Güvenlik basit bir ek unsur değil, temel bir ürün özelliğidir ve hiç kimse kendisiyle hizalı olmayan bir model istemez
- Kullanıcılar, her durumda güvenebilecekleri ve doğru olanı yapan bir model ister
- OpenAI, güvenliğe insanların düşündüğünden çok daha fazla, hatta belki de diğer tüm araştırma laboratuvarlarından daha fazla yatırım yapmış olabileceğini düşünüyor
- ChatGPT, dünyada en çok kişinin kullandığı dil modeli dağıtım örneği olduğu için OpenAI güvenliğe dikkat etmek zorundadır ve bunu gerçekten de her zaman yaptığını belirtiyor
- Başarılı ürünler geliştiren AI geliştiricilerinin güvenliğe çok güçlü yatırım yapmadığı sürdürülebilir bir durumun olmadığını düşünüyor
-
Toplumsal dayanıklılık ve OpenAI Foundation
- Güvenlik yalnızca modelin kendisiyle değil, toplumun nasıl dayanıklılık kazandığıyla da bağlantılıdır
- Otomobiller için emniyet kemeri ve yollar gerekir; elektrikte ise güvenlik standartları ve direkler ile yüksek gerilim hatlarının yerleşimi gibi kurallar vardır
- AI'da da önemli olan yalnızca modelin kendisi değil, dünyaya nasıl entegre olduğu ve toplumun nasıl dayanıklılık kazandığıdır
- OpenAI Foundation, toplumun AI için dayanıklı bir katmana yatırım yapmasına ve bunu inşa etmesine yardımcı olmayı temel odak noktalarından biri olarak görüyor
-
Modelin politik önyargısı, tarafsızlık ve kullanıcı tercihlerini öğrenme
- OpenAI, modelin tarafsız olmasını ve gerçeği temsil etmesini sağlamak için çok çaba harcadığını; modele giren değerlerin ve çalışma biçiminin web sitesindeki açık spesifikasyonda görülebileceğini ve geri bildirim de verilebileceğini söylüyor
- Twitter ekran görüntüleri, arkadaki bellek, gizli talimatlar ve önceki konuşma bağlamı nedeniyle yanıtların belirli bir yöne ayarlandığı durumlar içerebilir; bu yüzden her zaman tamamen dürüst olmayabilir
- Bazı soruların doğru cevabı yoktur ve tek kelimeyle yanıt vermek istendiğinde, hangi yanıt verilirse verilsin önyargı iddiası ortaya çıkabilir
- OpenAI'nin önemli gördüğü temel unsur, gerçek ve kullanıcıyı temsil eden bir AI'dır
- Modeli kullanıcı tercihine göre eğitme yöntemi zaman içinde evrildi ve bir dönem model, kullanıcının duymak istediği şeyi söyleme yönüne kaymıştı
- Hedef, modelin kullanıcının uzun vadeli hedeflerine ve uzun vadeli esenliğine yardımcı olmasıdır; kısa vadeli tatmin için "grader hacking" yaşanmaması adına teknik iyileştirmeler yapıldı
-
Düzenleme, veri merkezi endişeleri ve ulusal strateji
- AI düzenlemesi, teknolojinin nihayetinde insanlara fayda sağlamasını güvence altına almalı ve bir zamanlar istikrarlı sayılan kurumların, mesleklerin ve yaşam yollarının artık istikrarlı olmayabileceği gerçeğini ele almalıdır
- Herkesin compute'a erişmesi gerekip gerekmediği ve teknoloji daha fazla ekonomik değer ürettiğinde bu değerin tek bir yerde birikmemesi için nasıl bir yol izleneceği, düzenlemenin temel soruları haline geliyor
- ChatGPT kullanımı sayesinde kendisinin ya da sevdiği birinin hayatının kurtulduğunu söyleyen insanlar var ve bu tür kullanımların desteklenmesi ve korunması gerektiği düşünülüyor
- Doktor veya avukatla yapılan konuşmalar yasal olarak korunan ayrıcalıklı görüşmelerdir, ancak AI için henüz böyle bir sistem yok
- Veri merkezlerinin elektrik faturalarını yükseltip yükseltmediğine dair endişeler var ve OpenAI bunun böyle olmamasını sağlayacağına dair bir taahhüde sahip
- Veri merkezlerinin su kullanımı hakkında çok şey söyleniyor, ancak OpenAI veri merkezlerinin çok az su kullandığını ve çok su tükettikleri yönündeki söylemlerin yanlış bilgi olduğunu belirtiyor
- Su kullanımının düşük olmasının nedeni kapalı döngü yapısı; yani yüzme havuzu büyüklüğünde bir miktar su doldurulup bunun sürekli dolaştırılması
- Mevcut durumun bir "küresel AI yarışı"ndan çok küresel bir AI rönesansına daha yakın olduğu ve ülkeler arası dinamiklerin henüz tamamen belirlenmediği düşünülüyor
- ABD'nin AI'da lider konumda olması, demokratik değerlerin korunup muhafaza edilmesi açısından önemli görülüyor
- Ülkeler, AI ekonomik güvenliğin ve ulusal güvenliğin temeli haline geliyorsa bir şekilde sürece katılmaları ve bir egemen AI stratejisi gerektiğini fark ediyor
- Çip ihracatı ve teknoloji ihracatı çok sert biçimde kısıtlanırsa diğer ülkeler kendi rakiplerini geliştirebilir veya başka sağlayıcılara bağımlı hale gelebilir; fazla gevşek olunursa da ABD üstünlüğünü kaybedebilir
- Liderlik yalnızca önde olmak değil, dünyayı da birlikte ileri taşımayı içerir
İşler, gerekli yetkinlikler ve arzu edilen gelecek
-
İş güvencesizliği ve kazanılacaklar
- Yapay zekanın tam olarak nasıl gelişeceği belirsiz; şaşırtıcı biçimlerde ortaya çıkabilir ve bugünün yapay zekası ile dünya da bilimkurgunun öngördüğünden farklı
- Değişimin geldiği inkâr edilemez; neyin kaybedileceğini görmek kolaydır ama neyin kazanılacağını önceden görmek çok daha zordur
- 1950’de yaşayan birine bilgisayarlar, cep telefonları ve GPS sayesinde 3 dakika içinde bulunduğun yere bir araba çağırabildiğini anlatsanız tuhaf gelirdi; ama gerçekte bu tür teknoloji yatırımları binlerce, on binlerce, milyonlarca kullanım alanına dönüştü
- Yapay zekanın özü yetkinlik artırımı ve insanın özne oluşudur; bazı kurumlar ve meslekler sanıldığından daha az istikrarlı olabilir ve bu insanları etkileyecektir
- Birden çok yapay zeka teknolojisi nesline bakıldığında, önceki nesil teknolojileri önce öğrenenlerin sonraki nesilde de en büyük faydayı elde etme eğiliminde olduğu görülüyor
- Temel yetkinlikler özne olma, vizyon ve fikirlerdir; ayrıca denemeye başlamanın giriş eşiği hiç olmadığı kadar düştü
- Dünya, belirsizlik ve dönüşümden geçen herkesi nasıl destekleyeceğini düşünmeli; ekonomi ise compute tabanlı ekonomiye dönüşecek
-
Genç kuşağın öğrenmesi gerekenler
- Lise öğrencileri, üniversiteliler ve kariyerinin başındaki kişiler için önemli yetkinlik, yapay zekayı derinlemesine kullanmak ve yapay zekadan azami verimi nasıl alacağını anlamaktır
- Gelecekte herkesin ajanların yöneticisi, hatta daha da ötesinde otonom yapay zeka şirketinin CEO’su olduğu bir dünyaya gidebileceğimizi düşünüyor
- 100 bin kişilik bir şirketin iş gücünün tamamının kişi için 24 saat çalıştığı bir durum hayal edilebilir; bunun için ise token ve compute gerekir
- Herkesin compute’a erişmesi, dünyanın doğru şekilde çözmesi gereken temel meseledir
- Bundan sonra önemli yetkinlikler; yapay zekayı nasıl kullanacağını bilmek, teknolojileri yeni biçimlerde birleştirmek, ajanlarla etkileşim kurup onları yönetmek ve kişinin ne istediğini ve amacını anlamasıdır
-
Riskler ve arzu edilen gelecek
- Bugüne kadar teknoloji çoğu kez insanın kendini ve yaşamını makinelere uyacak şekilde bükmesi anlamına geldi; bir kutunun önünde yazı yazıp karpal tünel sendromu ve öne düşmüş omuzlar yaşamak insan için doğal değil
- Bundan sonra bilgisayarla çalışılan bir dünyadan, bilgisayarın insan için çalıştığı bir dünyaya geçiyoruz; bu da aynı anda hem fırsatlar hem riskler yaratıyor
- Eğer makineler insanların hedeflerini gerçekleştirmeye yardımcı olacaksa, birbiriyle çatışan hedeflerin nasıl uzlaştırılacağını ve yapay zekanın neye yardım edip neye etmeyeceği sınırını belirlemek gerekir
- Yapay zekanın topluma nasıl gireceğini ve faydaların tek bir şirkete ya da tek bir gruba gitmeyip herkesi yukarı taşımasını sağlayacak yolları bulmak gerekir
- Herkesin iyi bir yaşama ve bu teknolojiye erişip onunla bir şeyler yapabilmesine olanak tanımak için tabanı yükseltmek gerekir; buna bağlı olarak tavanın da yükseleceği düşünülüyor
- Sağlık hizmetlerine erişimde, herkesin cebinde bugünün herhangi bir doktor ekibinden daha iyi bir doktora sahip olduğu bir dünya mümkün olabilir
- Bu değişim yıkıcıdır ve bedelsiz gelmez; ilk hatalar da şimdiden ortaya çıktı
- Önümüzdeki 2 yıl içinde bunun iyilik için bir güç olabileceğini düşünüyor; ancak bu yükseliş potansiyeline ulaşmak için, işlerin nasıl ters gidebileceğini ve riskleri de birlikte kabul etmek gerekiyor
-
Kişisel ölçütler ve başarının tanımı
- Sadece makale yazmak, atıf almak ve konferanslarda dikkat çekmek misyonu gerçekleştirmeye yetmez; bunun “o faaliyetin AGI’nin dünyayı daha iyi bir yöne götürmesine nasıl katkı sağladığı” ile bağlantılı olması gerekir
- Ilya’nın ifadesiyle “acı çekmek gerekir” diye bir bakış açısı var; acı yoksa, değer üretilmiyor demeye yakın bir anlam taşıyor
- OpenAI’nin yaklaşımı, sorunları görmezden gelip körlemesine ilerlemek değil; zor gerçeklerle yüzleşmeye ve gerçekliği olduğu gibi anlamaya daha yakındı
- Teknik olmayan kişilere yapay zekayla ilgili iletmek istediği anlam, bunun kişisel yaşama yardımcı olacağı, bilim ve tıbbı ilerleteceği ve herkesi yukarı taşıyan iyilik yönünde bir güç olacağıdır
- Başarı, OpenAI’nin misyonudur; yani yapay genel zekanın tüm insanlığa fayda sağlamasını güvence altına almak
1 yorum
Hacker News görüşleri
Eski bilgisayar dergilerinin programcılara yönelik olduğu ve içinde kod listeleri yayımlandığı zamanları hatırlıyorum
Sonra bir noktadan itibaren sadece IBM ile Microsoft arasındaki davadan söz etmeye başladılar ve ardından sanki formülü bulmuş gibi sadece bilgisayar şirketlerinin iç siyasetini konuşur oldular. Şirketten şirkete bu tür haberler sıkıcı; teknoloji dünyasının reality TV'si gibi. Bu akşam Debra mı elenecek, Deborah mı elenecek, onun gibi
Dünyanın baktığı taraf, gerçek teknolojiden çok, o teknolojinin mümkün kıldığı çılgın düzeyde para, güç, etki ve entrikaya daha yakın. IBM ile Microsoft döneminde de bunun ölçeği büyüktü ama bugün OpenAI gibi bir çağdaki ölçek hayal edilemeyecek düzeyde. Mühendislik/teknoloji tarafıyla bağlantısını sadece o öteki yüze duyduğu ilgi nedeniyle kurmuş bir nesil de var. Eski Byte magazine günlerini özlüyorum
Tamamını dinlemek istemiyorsanız buradan bakabilirsiniz: https://apecast.app/podcast/the-knowledge-project/episode/op...
Brockman'ın geçmişe nasıl baktığını gösteren, Musk davası sürecinde ortaya çıkan bir kişisel günlük de var
Örneğin içinde “Financially what will take me to $1B?” gibi bir cümle geçiyor. Bu arada Musk davayı çok geç açtığı için kaybetti
Neden kimsenin Ilya'nın aslında ne düşündüğünü sormadığını anlamıyorum
Sam'i kovup sonra da Sam kovulursa OpenAI'den ayrılacağını söyleyen dayanışma mektubunu imzalaması bana hiç mantıklı gelmiyor. Bunun dışındaki tüm bilgiler de yüzeysel görünüyor
Bunu gerçekten uygulamak çok daha zor olurdu gibi geliyor ama belki de insanlara bunun kaçınılmaz sonuç olduğuna inandırdı
Nedenini bilmiyorum ama bu bölüm bana oldukça sıkıcı geldi
Sanırım bunun nedeni, beklenmedik ya da bilinmeyen neredeyse hiçbir şey paylaşmaması
O olayın OpenAI'yi öldüreceğini sanmıyorum. Hatta düzeltirdi
İlginç olan, cevabı aslında neredeyse tesadüfen bulmuş olmaları. Ön eğitim büyük ölçekli denetimsiz öğrenme, RLHF ise pekiştirmeli öğrenme. Sadece tarifi henüz bilmiyorlardı
Bir kâr amacı gütmeyen kuruluşun bunu nasıl yapabildiğini anlamıyorum
Bu durumda kâr amacı gütmeyen yapının aslında hiçbir anlamı olmadığına dair bir emsal oluşmuyor mu? İşine gelen yapıyı kullanıp, kendilerinin zengin olacağı an geldiğinde yapıyı değiştiriyorlar gibi
OpenAI, 2015'te Delaware'de bir kâr amacı gütmeyen kuruluş olarak kuruldu ve 2017'de ölçek büyütme yasalarını keşfettikten sonra, beklediklerinden çok daha fazla hesaplama gücü ve sermayeye ihtiyaç duyduklarını anladı. Bunun ardından daha fazla fon toplamak için yapı değişikliği müzakereleri başladı; diğer kurucular Musk'a kontrol vermeyi kabul etmeyince Musk ayrıldı. 2018'de Elon'un katkıları kesilmiş olmasına rağmen bağış toplamayı ciddi biçimde artırmaya çalıştılar ama 100 milyon dolarlık hedefin yalnızca 50 milyon dolarını toplayabildiler. 2019'da ticari sermayeyi çekebilmek için kâr sınırli bir yan kuruluş kurdular ve kâr amacı gütmeyen ana kuruluş, bağımsız değerleme uzmanları tutarak fikri mülkiyetin değerini biçti, ardından bunu yaklaşık 60 milyon dolarlık adil piyasa değeri üzerinden kâr amaçlı kuruluşa devretti. Karşılığında, kâr amacı gütmeyen ana kuruluş, kâr oluşması hâlinde orijinal fikri mülkiyet yatırımı için 100 katına, yani 6 milyar dolara kadar ödeme alma hakkı ve gelecekte yatırımcılar sınırlarına ulaştıktan sonra kalan artık kârlardan pay alma hakkı elde etti. Microsoft, 2019'da 1 milyar dolar, 2021'de 2 milyar dolar ve 2023'te 10 milyar dolar yatırım yaptı; her yatırımda 20 kat veya 6 kat sınır vardı ve toplam hedef geri ödeme tutarı 92 milyar dolardı. 2025'te kâr sınırli yapıdan, geleneksel hisseye sahip bir kamu yararına çalışan şirkete yeniden sermayelendirme yapıldı; kâr amacı gütmeyen ana kuruluş, artık kâr haklarını ve mevcut 60 milyon dolarlık devirdeki 100 kat kâr sınırını devretmesi karşılığında kâr amaçlı kuruluşun %26 hissesini aldı ve bunun bugünkü değeri yaklaşık 200 milyar dolar. Bunlar Musk v. Altman kayıtlarından geliyor ve sonuç olarak kâr amacı gütmeyen kuruluş, 2019'da yaklaşık 60 milyon dolarlık fikri mülkiyeti gelecekte 6 milyar dolarlık kâr hakkıyla değiştirdi, yeniden sermayelendirmeden sonra da 200 milyar dolarlık hisseye sahip oldu. Bu başlıkta birçok kişi kâr amacı gütmeyen kuruluşun artık var olmadığını düşünüyor ama bu doğru değil
Usulen söylemek gerekirse, şu anda en önemli AI şirketi Anthropic