Açık kaynak yapay zeka mutlaka kazanmalı
(opensourceaimustwin.com)- Yapay zeka; iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasite için medeniyet ölçeğinde bir altyapıdır ve erişim birkaç şirketin koşulları ile fiyatlarına bağlı olmamalıdır
- İzin almadan akıllı sistemleri araştırma, kurma, onarma, dağıtma, denetleme, ayarlama, eğitme, koruma ve çalıştırma yeteneği, işletim özgürlüğü ile doğrudan bağlantılıdır
- Açık kaynak yapay zeka; bugünün baskın araştırma laboratuvarları, yurtdışındaki araştırma laboratuvarları, donanım üreticileri, bulut platformları ve açık ağırlıklı model sağlayıcıları yön değiştirse ya da ortadan kalksa bile kullanılabilirliğini korumalıdır
- Az sayıdaki kapalı frontier laboratuvarı ve platform şirketi modelleri kontrol ederse, zeka altyapısının bilişin abonelik ekonomisine dönüşme riski vardır
- ABD, zeka altyapısını çalıştırma, inceleme, değiştirme, benchmark etme, eğitme ve koruma özgürlüğünde geride kalmamalıdır; pratik yaklaşım, ABD kapasitesi ile küresel açık standartların birleşimi olmalıdır
Açık kaynak yapay zeka mutlaka kazanmalı
- Zeka yalnızca az sayıdaki kapalı kurumdan ödünç alınabilen bir şeye dönüşürse, halk sadece yazılım özgürlüğünü değil işletim özgürlüğünü de kaybeder
- Akıllı sistemleri izin almadan araştırabilmek, kurabilmek, onarabilmek, dağıtabilmek, denetleyebilmek, ayarlayabilmek, eğitebilmek, koruyabilmek ve çalıştırabilmek gerekir; bu yetenek varoluşsal olarak önemlidir
- Yapay zeka; iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasiteyi taşıyan medeniyet ölçeğinde bir altyapı olarak görülmektedir
- Yapay zekaya erişim; kapalı API'lere, uzak platformlara, değişen kullanım koşullarına, şeffaf olmayan ayarlamalara, model erişilebilirliğine ve birkaç şirketin belirlediği fiyatlara bağımlı olmamalıdır
Açık kaynak yapay zekanın koruması gereken koşullar
- Açık kaynak yapay zeka kullanılabilir, anlaşılabilir ve yeniden üretilebilir olmalıdır
- Açık kaynak yapay zeka yerel dağıtıma uygun olmalı, ekonomik olarak sürdürülebilir olmalı ve topluluk yönetişimi mümkün olmalıdır
- Bugünün baskın araştırma laboratuvarları, yurtdışındaki araştırma laboratuvarları, donanım üreticileri, bulut platformları ve açık ağırlıklı model sağlayıcıları yön değiştirse ya da ortadan kalksa bile açık kaynak yapay zeka çalışmaya devam etmelidir
- Az sayıdaki kapalı frontier laboratuvarı ve platform şirketi modelleri kontrol ederse, zeka altyapısının bilişin abonelik ekonomisine dönüşme riski vardır
- ABD, zeka altyapısını çalıştırma, inceleme, değiştirme, benchmark etme, eğitme ve koruma özgürlüğünde geride kalmamalıdır
- Pratik yaklaşım, ABD kapasitesi ile küresel açık standartları birlikte gözeten bir model olmalıdır
2 yorum
Lobste.rs görüşleri
Açık kaynak “AI” diye bir şey yok. Yerelde çalıştırılabilen LLM’ler, her sürümün eğitimi için milyonlarca dolar harcayan ve girdi verisini tamamen kontrol eden dev şirketlerin lütfuyla sunulan opak bir yığından ibaret
Bağımsız olarak zengin olmayan bireyler, modelin nasıl üretildiğini tamamen inceleyemez, özgün eğitim veri setini düzenleyemez ya da istedikleri zaman sıfırdan yeniden oluşturamaz
Kişisel bilgisayarda mutlaka önceden derlenmiş ücretsiz bir LLM çalıştırmak, merkezi altyapıya karşı yetiştirilmiş bir bağımlılıktır ve bugünün gerçekliğinde bireyin yapısal olarak kontrol edemeyeceği bir teknolojiyi desteklemeye daha yakındır. Bunun yerine soğuk füzyonun kazanması gerektiğine dair bir manifesto yazmak daha iyi olurdu
Elbette bu modellerin çoğu, teknik kapasite bakımından frontier modellerle aynı seviyede değil ve baştan beri hedefleri de bu olmayabiliyor. Örneğin AB, çeviri gibi amaçlar için AB içindeki dilleri daha iyi temsil eden modellerin geliştirilmesini finanse etti
Ayrıca açık kaynak modelin tanım gereği mutlaka yerelde çalıştırılabilir olması gerektiğini düşünmüyorum. Bir model gerçekten açıksa, arkasındaki şirket batsa bile modelin daha fazla geliştirilmesine temel oluşturan şey şirket içinde kilitli kalmaz; bu da riski ciddi biçimde azaltır. Açık kaynak yazılım mutlaka “kendi yerel makinemde ucuza yapabilirim” anlamına gelmez
Yakın dönemde görece açık LLM’ler arasında NVIDIA-Nemotron-3-Nano-30B-A3B (açık kaynak kod, eğitim veri setinin büyük kısmı mevcut) ve Olmo-3.1-32B-Think (açık kaynak kod, tüm eğitim verisi Hugging Face’te yayımlı) bulunuyor
Teorik olarak herkes benzer bir modeli yeniden üretebilir, hangi verinin eğitimde kullanılacağına karar verebilir ya da eğitim tarifini değiştirebilir. Ama zengin olmayan bireyler için ön eğitim hâlâ erişilemez durumda; bu doğru
OLMo, OSI’nin doğrulama aşamasını geçmiş bir model olarak açıkça belirtiliyor ve Pythia’nın da OSI tarafından açık kaynak AI sistemi gereksinimlerini karşıladığı doğrulandı. Lucie-7B, OSI AI tanımını izleyen ilk çok dilli LLM’lerden biri ve geliştiricileri eğitim veri seti, veri hazırlama kodu ve model ağırlıklarının tamamının açık lisansla sunulduğunu belirtiyor
Sıfırdan eğitmenin çok pahalı olduğu da doğru. Ama o zaman Linux çekirdeğini kullanmaya da “yetiştirilmiş bağımlılık” mı diyeceğiz, diye merak ediyorum. Çünkü aynı çekinceler orada da geçerli
“AI, iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasite için medeniyet altyapısıdır” değil. Onu kontrol edenler böyle olmasını istiyor ve bunu umutsuzca zorluyor, ama gerçekte öyle değil
Düşünmeyi, çok kaynak tüketen, telif ihlali yapan ve halüsinasyon gören makinelere dış kaynak olarak vermeyin yeter 😘
Elbette bu gücü birkaç dev şirketin elinde yoğunlaştırmamak, bugünkü AI’nin büyük sorunlarından birini çözer; ama diğer sorunların hiçbirini çözmez
Fiilen işe yarayan en küçük yerel kodlama ajanı Qwen3.6 27B ve güç sınırı uygulanmış bir NVIDIA kartında aralıklı olarak yaklaşık 280~300W ile gayet rahat çalışıyor. Bir günlük kodlama için harcadığı elektrik, masaüstü bir gaming makinesinde birkaç saat Subnautica 2 oynamaktan daha az olurdu. Bunun nedeni kısmen küçük modellerle düşünmeyi çok fazla dış kaynaklaştıramamanız; yani AI dinlenirken insanın düşündüğü zaman daha fazla oluyor
Eğitim maliyeti daha yüksek, ama yılda yalnızca birkaç tane 27B ölçeğinde model eğitmek istiyorsanız bu, sanayi uygarlığının bütünü içinde kaybolur gider. Daha önce kabaca hesapladığımda, İzlanda’da jeotermal enerjiyle çalışan bir alüminyum eritme tesisine bir tane daha eklemek, birkaç 27B sınıfı modeli rahatlıkla eğitmeye yeter gibi görünüyordu. Bedava değil ama yuvarlama hatasına yakın
Çıkarım sırasındaki güç tüketimi üç akkor ampulden daha az ve o da yalnızca model gerçekten üretim yaparken. Eğitim sırasındaki güç tüketimi tek bir büyük sanayi tesisi seviyesinde, ama bunun neredeyse tamamı yenilenebilir enerjiyle de yapılabilir. İzlanda bu açıdan iyi
“Telif ihlali” iddiası, mevcut ABD içtihadına göre şu anda pek doğru görünmüyor ve telif yetkilerini daha da büyütme konusunda temkinli olmak gerekir. 90’lardan beri telif genişlemesine karşı olduğum için, LLM eğitiminin nasıl yapıldığını beğenmesem de bu mesele artık telif hukukunun alanından çıkıp siyaset ve yasama alanına kaymış gibi duruyor. Yine de Anthropic’in kitapları düpedüz korsanlaması bunun istisnası
Ama düşünmeyi dış kaynaklaştırma sorunu hızla berbat bir hâl alıyor. Birçok insan kendini makine tanrısının et kuklasına çevirmeye çalışıyor ve bu korkutucu
Bu, cinayetin kötü olma nedenini “yasadışı olduğu için” diye açıklamaya benziyor. Cinayet kötüdür, evet, ama kötü olmasının nedeni yasadışılığı değildir. Yasalar değişebilir. AI’nin telif yüzünden kötü olduğu fikri etrafında bir akım oluşturup sonra meclis bunu yasallaştırırsa, herkes bir anda AI’yi kabul edilebilir mi sayacak? Asıl kaygının merkezine daha yakın başka itirazlar vardı ve onların etrafında toplanmak daha üretken olabilirdi
Alexandra Elbakyan da bir telif ihlalcisi. Ama kendisi bir yetişkin ve her üniversitede heykeli olmalı
Gerçekten açık ve adil bir makine öğrenimi ve büyük dil modeli geleceği, tüm tedarik zinciri hesaba katılmadan mümkün değil. https://time.com/6247678/openai-chatgpt-kenya-workers/ okunmasını tavsiye ederim
Yakında veri zirvesine ulaşacağız ve bundan sonraki gelişmelerin büyük kısmı muhtemelen en güncel LLM’leri ajanvari şekilde paketleyip birlikte kullanmaktan gelecek
Kamuya açık olarak yayımlanan son açık kaynak modelin, önümüzdeki yıllar boyunca sürekli değişen açık kaynak ajan tabanlı ya da başka üstyapıların temeli olarak kullanılması muhtemel
Daha doğrusu, halkın son 20 yılda, özellikle de yakın dönemde, büyük teknoloji şirketlerinin aldığı muazzam kamu fonunu fark etmesi ve vergilerle finanse edilen altyapı üzerindeki hakkını talep etmesi gerekiyor
Bu şirketler, devasa kamu kaynakları aktarımı olmadan ne var olabilirlerdi ne de bugün varlıklarını sürdürebilirlerdi. Üstelik eğitim verisinin de önemli bir kısmı doğrudan kamusal ortak havuzlardan alındı
Bu modeller özel çabanın ürünü değil, devasa bir kolektif emeğin nihai sonucu ve hukuken kamusal müşterek olarak tanınmalılar
Önemli olsun ya da olmasın, balon olsun ya da olmasın, halüsinasyon gören token tahminleyicileri olsun ya da olmasın, tüm ülkelerin “Frontier lab”leri en yeni model dışındaki modelleri açık kaynak olarak yayımlamaya zorlayacak bir hukuki çerçeveye sahip olması çok önemli
Açıklanacak kapsamın içinde ağırlıklar, eğitim verisi, metodoloji vb. yer almalı; ya da her modelin 10~15 yıl sonra açık kaynak hâline gelmesi zorunlu tutulmalı. İnsan bilgisinin ilerlemesi ve “sahip olanlar” ile “olmayanlar” arasındaki ayrımın önlenmesi için, tüm modeller belli bir sürenin ardından kamunun erişimine açılmalı
AGI’nin yakın olmadığını düşünüyor olabilirsiniz, ama bu frontier laboratuvarlarının niyeti AGI’ye ilk ulaşan olmak ve sonra onu ücretli bir duvarın arkasında tek başına tutmak. Olasılığı yüksek ya da düşük olsun, insanlığın bütünü yararına bunun engellenmesi gerekir
Hacker News görüşleri
Bir süredir, gönüllü katkı yapan makinelerle bir dağıtık model eğitimi sistemi kurmayı düşünüyorduk, ancak pratikte zorluk seviyesi astronomik derecede yüksek.
İletişim hızı kaldırmıyor ve güvenilmez düğümlerden gelen veri kirlenmesi de sorun.
İkincisi, kirlenmiş verinin ardından gelen tüm sonuçları çöpe atmak zorunda bırakmayan kendi kendini iyileştiren checkpoint rollback sistemiyle neredeyse çözülebilir gibi görünüyor, ama bu bir kişinin sadece fikirle yapabileceği küçük bir proje değil.
Eğer artık tüm frontier araştırma laboratuvarlarının ek ilerleme kaydetmesi yasaklanacak bir durumdaysak, böyle bir yöne ilgi doğabilir.
Dünya üzerindeki tüm GPU’ların toplamı onların kapasitesini aşardı, ama bunu verimli biçimde dağıtık kullanmanın bir yoluna ihtiyaç var.
Fable’ı onlar kadar hızlı eğitemesek bile, bir gün erişebilir olmak hiç erişememekten iyidir.
AI’ye özel donanım, tüketici GPU’larından yalnızca çok daha hızlı değil, aynı zamanda enerji verimliliği çok daha iyi ve bağlantı kabiliyeti de çok daha üstün; bu üç eksenin her biri tek başına bu fikri çökertiyor.
Enerji verimliliği farkı o kadar büyük ki, dünyadaki tüm açık GPU’ları ya da benzer cihazları toplasanız bile elektrik faturası aşırı yükselir ve o parayla kendi veri merkezinizi kurmak toplam maliyet açısından daha ucuza gelebilir.
Elektrik bedava olsa bile, dünyaya dağılmış GPU’ları internet gecikmesiyle birbirine bağlarsanız binlerce ila milyonlarca kat daha yavaş olur ve bunun mümkün olup olmadığı da belirsiz.
Her hâlükârda bu on yıl içinde fable-oss elde etmek zor ve belki bu yüzyılda bile mümkün olmayabilir.
Hükümetlerin, ister ittifak biçiminde olsun, veri merkezlerini doğrudan satın alıp sahip olarak kamu yararı için işletmesi daha iyi olur; hatta bence gerçekten böyle yapılmalı.
Bunun yerine, binlerce küçük veri merkezinin ya da bireysel kullanıcıların internet üzerinden boşta kalan hesaplama gücünü bir araya getirip tek bir aktörünkünden daha büyük bir eğitim çalışmasını koordine etmesini düşünüyorlar.
Pluralis Research, Prime Intellect ve Nous Research gibi şirketler bu vizyonun peşinden gidiyor ve şimdiden anlamlı ölçekte dağıtık eğitimde başarı sağladılar, ancak internet tabanlı dağıtık eğitim hâlâ merkezi eğitimden çok geride.
En büyük modeller olan Pluralis’in 8B Protocol Model’i, Prime Intellect’in INTELLECT-1’i ve Nous’un Consilience 40B’si bile xAI’nin Grok 4 gibi güncel frontier modellerinden 1.000 kat daha az hesaplama ile eğitildi.
https://epoch.ai/gradient-updates/how-far-can-decentralized-...
Ne kadar çok silikonun tam da bu şirketlere gittiği ve bu silikonun tüketici ekipmanına kıyasla ne kadar güçlü olduğu yanlış anlaşılıyor.
BLOOM modeli de işbirliğiyle ortaya çıkan bir sonuçtu: https://huggingface.co/docs/transformers/en/model_doc/bloom
Nous bunu zaten başardığını iddia ediyor: https://github.com/NousResearch/DisTrO
Geçmişte de yüksek sıkıştırma oranları bildiren gradient sıkıştırma makaleleri vardı.
Buna ek olarak dağıtık LLM çıkarımı da gerekli.
Artık tek bir kişinin en yeni modeli çalıştıracak donanımı kurmasının fazla pahalı olduğu noktaya geldik.
Bu yüzden bireylerin kaynaklarını paylaşarak en yeni modeli dağıtık biçimde çalıştırabilmesini sağlayacak bir framework oluşturup benimsemeliyiz.
Böylece hükümetlerin sansür uygulaması da zorlaşır.
Bunu tek bir aktörün silaha dönüştürmesini engellemenin tek yolu, herkese erişim vermektir.
Mac, Windows, Linux, Android, iOS, hatta HarmonyOS üzerinde tamamen dağıtık çıkarım çalıştırıyor.
Açık kaynak/açık ağırlıklı modeller gelişmeye devam edecek ve sonunda akıllı telefon ya da gözlük donanımında bile mythos seviyesinde bir şey çalışacak.
Ancak şu anda arz ve talebi eşleştirmek korkunç derecede zahmetli.
Örneğin 16GB RAM’li bir MacBook fiziksel olarak gerçekten 16GB’ın tamamını kullanabiliyor demek değil; ayrıca model ve ayarları (kvcache, context limit, temperature vb.) taleple eşleştirme sorunu da var.
İnsanlar tarafından, insanlar için yapay zeka çıkarımına ihtiyaç var; yardım memnuniyetle karşılanır.
Petals adlı bir proje 180B modelde en fazla 4 tok/s iddia etmişti ama depo 2 yıldır güncellenmiyor.
https://petals.dev/
Politika alanında, hükümetin hem erişimi hem de tekelleşmeyi düzenlediği yaklaşımlar da bulunur.
Bu teknolojinin tekel altında olmasına karşıyım, ancak herkese jailbreak yapılmış AGI/ASI vermenin riskleri de açık olmalı.
Oyuncak bir örnek olarak, hükümetin birden fazla laboratuvara (n_quorum) taşeronluk verip herkese token bütçesi sağladığı bir evrensel temel yapay zeka düşünülebilir.
Ancak API işletiminde güvenlik kontrolleri bulunmalı.
Herkes kendi jailbreak edilmiş AGI’sini çalıştırırsa, istikrarlı toplumsal normlar için geriye yalnızca kimin CBRNE tehdidi ürettiğini izleyen kitlesel gözetim kalıyor gibi görünüyor.
Bu, sivil özgürlükler açısından net bir zafer gibi görünmüyor, ama böyle bir mantığın kurulabildiğini anlıyorum.
Kendi evimde ve işimde en başından beri kazandı
Daha doğrusu açık ağırlıklar kazandı; bu ince fark ise rahatsız edici geliyor
Bir ürünün çalışmasını ya da geliştirilmesini, kârlılığı da belirsiz ve iç yüzü bilinmeyen iki büyük startup’tan birinin gizli kaynağına tamamen bağımlı hâle getiren yaklaşımı hiç anlayamadım
Bu, sağlıklı mühendislik ilkelerine de aykırı
Bu yüzden böyle yapma niyetim hiç olmadı; bugün AI’ı araştırmamın nedeni de açık ağırlıklar sayesinde buna zaman ayırmaya değeceğine karar vermiş olmam
Zaten işletmeler çoğu zaman tek bir ödeme platformunun ve iki ABD kredi kartı sağlayıcısının politikalarına bağımlı oluyor; bu bile fazlasıyla kötü
Belki serbest çalışan mizacım yüzündendir ama temel teknolojiyi değil de bir başkasının ürününü inceleyip öğrenmeye gereğinden fazla enerji harcamam beklendiğinde hep tedirgin oluyorum
Microsoft’un, NT kaynak koduna erişim vaadiyle bölümleri ikna etmeye çalıştığı dönemi de hatırlıyorum
O sırada bizim taraftaki üst düzey birinin, Linux’un tali bir şey olduğunu ve NT erişiminin bizi anlamlı kılacağını söylediğini de hatırlıyorum
Kendi kaderi üzerindeki kontrol her zaman daha fazla olmalı; ayrıca öncü uç teknolojinin en güncel istikrarlı teknolojinin ilerisinde olduğunu kendime ve çevreme hatırlatıyorum
İlerleme öncü uçta olur ama hasar riski de vardır
Mühendislik, başkasının ilerlemesinin üstüne binmeye değil, en güncel istikrarlı teknoloji üzerine inşa etmeye odaklanmalıdır
llama.cppgibi araçlar açık, ama ağırlıklar olmadan işe yaramıyorlarAğırlıklar, birbiriyle savaş hâlindeki büyük kurumların bağışladığı son derece pahalı bir sermaye
Örneğin
archive.org’un gerçekten açık ağırlıklar üretebileceğini bilmiyorum;archive.orgdışında dafreebsdya daapachegibi başka açık kaynak kuruluşlarının gerçekten açık ağırlıklar üretebilecek konumda olduğunu hayal etmek zorMümkünse belki hükümetler, devlet kurumları ve üniversiteler olabilir
Ama bugün bu kurumların, ağırlık üretmek için gereken altyapıya para akıtacak kadar finansmanı, yetkisi, iradesi ya da ilgisi yok
AI, işimizdeki geliştirme biçimini tamamlıyor ve mühendisler en iyi açık kaynak modellerden ziyade Opus 4.8 kullanmayı çok daha fazla tercih ediyor
Açık kaynağın önemli olduğuna inanıyorum ama kendi işimde kullanılabilecek en iyi araçları doğrudan kullanacağım
Açık kaynak ücretsiz yazılım anlamına gelmeye başladığında, bu fiilen ücretsiz bir kopya istemekle aynı kapıya çıkıyor
Söylememiz gereken şey, kamusal ve topluluk tarafından işletilen projelerin birlikte ön eğitim ve eğitim yapması gerektiği
Bu, eğitim derleminin kamusal biçimde ele alınması ve eğitim işinin bir şekilde koordine edilmesi anlamına geliyor
Bu, terimin anlamını tamamen değiştirmek olur; insanların korsanlık ile hırsızlığı birbirine karıştırmasına benziyor
Bunlar farklı şeyler, dolayısıyla farklı kelimeler kullanmalıyız
Ücretsiz ağırlıklar, çıkarım kodu ve sohbet şablonları, topluluk tarafından işletilen LLM projelerinden çok farklı
Buna kim finansman sağlayacak?
Eğitim maliyetleri hayal etmesi zor ölçüde pahalı
Ya yatırım getirisi peşindeki VC finansman modeli var ya da otoriter Çin toplumsal modelini sağlamlaştırmayı amaçlayan CCP finansman modeli
Üniversitelerin 4B ölçeğinde modelleri olabilir ama çok ileri gidebilecek gibi görünmüyor
Linux bilgisayarımın, trilyon dolarlık iki şirketin yaptığı işletim sistemleriyle neredeyse aynı deneyimi sunmasına her gün şaşırıyorum
Hatta o ticari alternatiflerin yapamadığı şeyleri bile yapıyor
Eğer DeepSeek gerçekten Batılı rakiplerinin maliyetinin 1/10’una ve personel sayısının yalnızca bir kısmıyla model çıkarabiliyorsa, bu alanda alternatif sunacak biri için bir pazar olduğu anlamına gelebilir
IBM gibi şirketlerin neden Linux’a isteyerek katkıda bulunduğunu ve bu katkıları ücretsiz sunduğunu düşünüyorum
Çünkü piyasadaki daha baskın ticari oyuncuya karşı bir alternatife ihtiyaç duyan kurumsal sponsorlar topluluğunun parçasılar
Meta’nın React’i fiilen ücretsiz sunmasının nedeni de benzer
Bir standart hâline gelmesi ve zaten bilen insanları işe alabilmesi Meta için daha avantajlı
AI modellerinde aynı ekosistem faydasını hayal etmek daha zor ama bir yerlerde olabilir
Veri merkezi/VPS sağlayıcılarının, büyük AI şirketlerinin pazarlık gücünü azaltmak için böyle bir şeyi desteklediğini hayal etmek mümkün
Elbette bu iyimserlik boş bir hayal de olabilir
Model üreticileri başkalarının çalışmalarını kazıyıp onunla eğitim yapabiliyor ve bilgiyi kendilerine aitmiş gibi aklayıp asıl yaratıcıya geri bir şey vermek zorunda kalmıyorsa, model damıtmanın neden yasa dışı olması gerektiğini anlayamıyorum
Bu, frontier model üreticilerinin genel olarak başkalarının fikri mülkiyetine yaptığı şeyle aynı
Eğitim bugün hayal etmesi güç olacak kadar pahalı
Ya birkaç üniversite parasını birleştirirse?
Ya birkaç ülke parasını birleştirirse?
Sonunda bir atılım olacak ve optimizasyonlar gerçekleşecek
İnsanlar açık kaynak bir işletim sisteminin uygulanabilir olup olmayacağından şüphe ediyordu ama Linux, onlarca yıldır masaüstü ortamlarında fiilî bir seçenek oldu; sunucu ve telefon işletim sistemi olarak ne kadar yaygın kullanıldığını söylemeye bile gerek yok
Eski modelleri kullanmanın bir değeri yok
Açık kaynak AI manifestosu “açık kaynak AI ekonomik olarak da sürdürülebilir olmalı” diyor ama bu daha çok temennili düşünceye benziyor
gpt-ossartık eski ama çıktığı zaman fena değildiNemotron da sağlam; özellikle son ultra sürümü iyi
Nvidia’nın hikâyesi özellikle Çin modelleriyle karşılaştırıldığında çok daha güçlü; çünkü yalnızca modelin kendisini değil, ön/son eğitim verileri dâhil her şeyi yayımlıyor
Kurumsal yan ürün olarak açık kaynak modeller elde etmektense, açık kaynak bir AI laboratuvarını desteklemek için ayda 50 dolar ödemeye fazlasıyla razıyım
O açık kaynak AI laboratuvarının bir şekilde kâr amaçlı bir şirkete dönüşmeyeceğini nereden bilebiliriz?
Belki onların API’sini kullanmaya başlamalıyım
O da kurumsal bir yan ürün değil
Açık ağırlıklı yapay zekada, eğitime ve araştırmaya büyük sermaye yatırmak için güçlü bir teşvik olmayabilir
Bağış fonları gibi şeyler ortaya çıkabilir, ama bunun frontier laboratuvarlarının aldığı finansman düzeyine yaklaşması doğal olarak zor olur
Bu yüzden yapay zekanın yalnızca açık ağırlıklarla var olması mümkün olmayabilir diye düşünüyorum
OpenAI, Anthropic, Google gibi başlıca oyuncular varlığını sürdürür ve açık kaynak sürümlerden daha iyi modellere sahip olma ihtimalleri yüksektir
Bu, Photoshop ile GIMP arasındaki ilişki gibi görünebilir
Photoshop frontier laboratuvarlarını, GIMP ise açık ağırlıklı modelleri temsil eder
GIMP, çeşitli görsel düzenleme iş akışlarında kullanmak için yeterince iyidir, ama Photoshop basitçe daha iyidir
Frontier laboratuvarlarından daha iyi açık ağırlıklı modeller olsa elbette güzel olurdu, ama bunun mümkün olduğunu sanmıyorum
OpenAI ve benzerleri de on-premise ürünler sunabilir
Bu ister appliance rack ister başka bir formda olsun, büyük şirketler veri egemenliği ve maliyet kontrolü için çıkarımı yerelde çalıştırmak isteyecektir
Özellikle üretim sanayisinde veya diğer ağdan yalıtılmış ağlara yapay zekayı entegre etme zamanı geldiğinde bu daha da geçerli olur
Şu an bir tür hızlı ölçeklenme aşamasındayız, ama yapay zekanın arkasındaki teknoloji gerçekten evrim geçirmezse giderek daha iyi modeller üretmek zorlaşacak ve azalan getiri görülecek
LLM dünyasının GIMP'i, VC fonlu modelin performansının %80'ini bile verirse birçok insan için fazlasıyla yararlı olacaktır
Özel mülkiyetli modeller kadar iyi olmadığı doğru olsa bile, açık kaynak modeli kullanma seçeneğinin olması bile bence bir zaferdir
Tüketicilerden trilyonlarca dolar çekip çıkarmanın imkansız olduğu ortaya çıktığında, trilyon dolarlık değerlemeler anlamsız görülecektir
Bu arada ve her halükarda, yazılım optimizasyonu ve donanım ölçeklenmesi sürerse çok geçmeden mobil cihazlarda Fable'dan daha üstün yeteneklere sahip açık ağırlıklı modeller çalışacaktır
Yine de bunun pratikte nasıl işleyeceğini bilmiyorum
Bazı yapay zeka modelleri o kadar büyük ki, makul şekilde çalıştırılmaları ancak en ileri hiper ölçekli veri merkezlerinde mümkün
Böyle modelleri açık kaynak olarak yayımlamak çoğu durumda anlamsız olur
Bu, bugün kamuya açık en büyük modellerden bile çok daha büyük ölçek demek; küçük ve ucuz geçici kümelerde yavaş çıkarım yapmayı bile dışlayan bir seviye
Fable zaten o noktada olabilir
Duyguya ve misyona katılıyorum, ama bu hedef artık siyasetten ayrı düşünülemez
Open Source(tm), devletin ya da başka aktörlerin silikon üzerinde veya o silikonun yapabilecekleri üzerinde kontrol kurmasını engelleyemez; nitekim bu zaten dünya genelinde yaşanıyor
Model açık kaynak olsa bile düzenlemeleri veya ekonomik teşvikleri çözmez
Bu, birkaç paragrafa sıkıştırılabilecek bir mesele değil
Yapay zeka medeniyet ölçeğinde bir altyapıdır ve sadece kaynak kodu değil, medeniyet ölçeğinde çözümler gerektirir
Herkes yapay zeka şirketlerinin eğitim için izinsiz şekilde veri aldığını biliyor, ama hiçbir şey olmayacak
Bu, hukukun sınıfsal uygulanışının açık bir örneği
Kendi yasalarını keyfî biçimde uygulamalarının gerekçesi her zaman ulusal güvenlik olacaktır
Altyapıya onlar sahip olduğu için, onların çıkarı ulusal güvenlik sayılacaktır
Teknoloji her büyük sıçrayış yaptığında dengeyi sarsabilir, ama finans kapitalizmi hızla uyum sağlayıp o dalgayı emer
Yazıda ele alınmadıysa, açık kaynak ile açık ağırlık arasındaki ayrım önemlidir
Açık ağırlıklı modeller neredeyse ilk doz bedava verilen bir giriş uyuşturucusu gibidir
En azından özgün eğitim verisi olmadan anlamlı yükseltmeler yapma kabiliyeti çok sınırlıdır; bu yüzden sürekli geliştirilen son teknoloji modellerin gerisinde hızla kalırlar
Sonra ya bir sonraki yayını beklersiniz ya da sağlayıcının API'sine geri dönersiniz
Sadece bilgi kesim tarihini ileri taşımak bile kullanıcı deneyimini gözle görülür biçimde iyileştirir; çıkarım, quantization-aware training ve ileride gelecek diğer pek çok iyileştirmeden bahsetmiyorum bile
Açık ağırlıklı modelleri iyileştirmeye yönelik araştırmalar yapılabilir, ama sonuç aynıdır
Açık kaynak değilse, genel halka sağladığı fayda çok daha küçük olur
Açık kaynak yapay zeka tanımı gereği asla kazanamaz
Günümüzde yapay zeka sonuçta tepe tırmanma optimizasyonuna yakın ve kapalı laboratuvarlar açık dünyanın yaptığı her şeyi emip onun üstüne daha fazlasını koyabilir
Çoğu kullanım senaryosunda bu büyük bir sorun değil, çünkü yapay zeka yetenek doygunluğu şeklinde çalışıyor
https://www.delanceyukschoolschesschallenge.com/the-rising-t...
İstisna yalnızca doğa ya da başka insanlarla özünde karşı karşıya olunan alanlar gibi, rekabete göre üstünlüğün önemli olduğu durumlardır
İkinci büyük zafer muhtemelen sıradan insanların bunu kendi donanımlarında çalıştırabildiği an olacaktır
Microsoft Linux'tan istediği kadar öğrenebilirdi ama Linux, ticari rakiplerine rağmen yalnızca alakalı kalmakla yetinmedi; Firefox'un bugünkü pazar payı gibi örneklerin aksine artık ezici farkla en yaygın işletim sistemi oldu
Açık sistemlerden tüm iyi fikirleri ya da verileri emebilme yeteneği tek belirleyici etken değil gibi görünüyor
Şu anda Fable ve Mythos en ileri seviyede ama yakında metalaşacaklar
OpenAI/Anthropic gibi en yeni modellerle önde gitmeye çalışan her bir şirkete karşılık, onun tamamlayıcılarını metalaştırmaya çalışan yaklaşık yüz şirket olacaktır
Açık kaynağın zaferi, kapalı modellere alternatiflerden en az birinin GPT-4 kadar iyi olması anlamına gelirse yeterlidir
Aslında Google Gemma modelleriyle neredeyse zaten o noktaya geldik
Bir yazılım mühendisi olarak Sonnet'ten sonrasında üretkenliğimde bir fark hissetmedim
Elbette Opus daha iyi ve Fable daha da iyi olabilir ama ekonomik değer açısından bakınca zaten azalan getiriye çarpmış durumdayız
Cursor'da ilk GPT modellerinden birini kullanırken Claude Code ve Sonnet'e geçtiğimde benim için neredeyse 5 kat üretkenlik artışı oldu
Claude Code'dan önce yapay zekayı yalnızca küçük kod parçaları için kullanıyordum ama Claude Code + Sonnet ile bütün alt görevleri devredebilir hale geldim
Yine de bir özelliğin tamamını baştan sona Opus'a bırakacak kadar güvenmiyorum
Bir gün bunun mümkün olacağından da emin değilim ve bunun mutlaka gerekli olması da gerekmeyebilir
Şirketler yazılım mühendislerinden belirli ölçüde yüksek yetenek bekler ama o seviyenin ötesine geçince gerçekten hiç umursamazlar
Fark büyük olsa bile bunu fark etmezler