2 puan yazan GN⁺ 4 시간 전 | 2 yorum | WhatsApp'ta paylaş
  • Yapay zeka; iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasite için medeniyet ölçeğinde bir altyapıdır ve erişim birkaç şirketin koşulları ile fiyatlarına bağlı olmamalıdır
  • İzin almadan akıllı sistemleri araştırma, kurma, onarma, dağıtma, denetleme, ayarlama, eğitme, koruma ve çalıştırma yeteneği, işletim özgürlüğü ile doğrudan bağlantılıdır
  • Açık kaynak yapay zeka; bugünün baskın araştırma laboratuvarları, yurtdışındaki araştırma laboratuvarları, donanım üreticileri, bulut platformları ve açık ağırlıklı model sağlayıcıları yön değiştirse ya da ortadan kalksa bile kullanılabilirliğini korumalıdır
  • Az sayıdaki kapalı frontier laboratuvarı ve platform şirketi modelleri kontrol ederse, zeka altyapısının bilişin abonelik ekonomisine dönüşme riski vardır
  • ABD, zeka altyapısını çalıştırma, inceleme, değiştirme, benchmark etme, eğitme ve koruma özgürlüğünde geride kalmamalıdır; pratik yaklaşım, ABD kapasitesi ile küresel açık standartların birleşimi olmalıdır

Açık kaynak yapay zeka mutlaka kazanmalı

  • Zeka yalnızca az sayıdaki kapalı kurumdan ödünç alınabilen bir şeye dönüşürse, halk sadece yazılım özgürlüğünü değil işletim özgürlüğünü de kaybeder
  • Akıllı sistemleri izin almadan araştırabilmek, kurabilmek, onarabilmek, dağıtabilmek, denetleyebilmek, ayarlayabilmek, eğitebilmek, koruyabilmek ve çalıştırabilmek gerekir; bu yetenek varoluşsal olarak önemlidir
  • Yapay zeka; iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasiteyi taşıyan medeniyet ölçeğinde bir altyapı olarak görülmektedir
  • Yapay zekaya erişim; kapalı API'lere, uzak platformlara, değişen kullanım koşullarına, şeffaf olmayan ayarlamalara, model erişilebilirliğine ve birkaç şirketin belirlediği fiyatlara bağımlı olmamalıdır

Açık kaynak yapay zekanın koruması gereken koşullar

  • Açık kaynak yapay zeka kullanılabilir, anlaşılabilir ve yeniden üretilebilir olmalıdır
  • Açık kaynak yapay zeka yerel dağıtıma uygun olmalı, ekonomik olarak sürdürülebilir olmalı ve topluluk yönetişimi mümkün olmalıdır
  • Bugünün baskın araştırma laboratuvarları, yurtdışındaki araştırma laboratuvarları, donanım üreticileri, bulut platformları ve açık ağırlıklı model sağlayıcıları yön değiştirse ya da ortadan kalksa bile açık kaynak yapay zeka çalışmaya devam etmelidir
  • Az sayıdaki kapalı frontier laboratuvarı ve platform şirketi modelleri kontrol ederse, zeka altyapısının bilişin abonelik ekonomisine dönüşme riski vardır
  • ABD, zeka altyapısını çalıştırma, inceleme, değiştirme, benchmark etme, eğitme ve koruma özgürlüğünde geride kalmamalıdır
  • Pratik yaklaşım, ABD kapasitesi ile küresel açık standartları birlikte gözeten bir model olmalıdır

2 yorum

 
GN⁺ 3 시간 전
Lobste.rs görüşleri
  • Açık kaynak “AI” diye bir şey yok. Yerelde çalıştırılabilen LLM’ler, her sürümün eğitimi için milyonlarca dolar harcayan ve girdi verisini tamamen kontrol eden dev şirketlerin lütfuyla sunulan opak bir yığından ibaret
    Bağımsız olarak zengin olmayan bireyler, modelin nasıl üretildiğini tamamen inceleyemez, özgün eğitim veri setini düzenleyemez ya da istedikleri zaman sıfırdan yeniden oluşturamaz
    Kişisel bilgisayarda mutlaka önceden derlenmiş ücretsiz bir LLM çalıştırmak, merkezi altyapıya karşı yetiştirilmiş bir bağımlılıktır ve bugünün gerçekliğinde bireyin yapısal olarak kontrol edemeyeceği bir teknolojiyi desteklemeye daha yakındır. Bunun yerine soğuk füzyonun kazanması gerektiğine dair bir manifesto yazmak daha iyi olurdu

    • Büyük ölçüde doğru, ama pratikte kamu fonlarıyla desteklenmiş, ağırlıkları, eğitim verisi ve metodolojisi yayımlanmış modeller de var
      Elbette bu modellerin çoğu, teknik kapasite bakımından frontier modellerle aynı seviyede değil ve baştan beri hedefleri de bu olmayabiliyor. Örneğin AB, çeviri gibi amaçlar için AB içindeki dilleri daha iyi temsil eden modellerin geliştirilmesini finanse etti
      Ayrıca açık kaynak modelin tanım gereği mutlaka yerelde çalıştırılabilir olması gerektiğini düşünmüyorum. Bir model gerçekten açıksa, arkasındaki şirket batsa bile modelin daha fazla geliştirilmesine temel oluşturan şey şirket içinde kilitli kalmaz; bu da riski ciddi biçimde azaltır. Açık kaynak yazılım mutlaka “kendi yerel makinemde ucuza yapabilirim” anlamına gelmez
    • Yerelde çalışan LLM’lerde de bir açıklık spektrumu var. Bazıları eğitim verisi ve yöntem bilgisi neredeyse olmayan opak yığınlar; bazılarıysa eğitim veri seti ve kaynak kodu açık olan modeller
      Yakın dönemde görece açık LLM’ler arasında NVIDIA-Nemotron-3-Nano-30B-A3B (açık kaynak kod, eğitim veri setinin büyük kısmı mevcut) ve Olmo-3.1-32B-Think (açık kaynak kod, tüm eğitim verisi Hugging Face’te yayımlı) bulunuyor
      Teorik olarak herkes benzer bir modeli yeniden üretebilir, hangi verinin eğitimde kullanılacağına karar verebilir ya da eğitim tarifini değiştirebilir. Ama zengin olmayan bireyler için ön eğitim hâlâ erişilemez durumda; bu doğru
    • Tam anlamıyla açık kaynak modeller kesinlikle var. Frontier modeller değiller ama gerçekten varlar
      OLMo, OSI’nin doğrulama aşamasını geçmiş bir model olarak açıkça belirtiliyor ve Pythia’nın da OSI tarafından açık kaynak AI sistemi gereksinimlerini karşıladığı doğrulandı. Lucie-7B, OSI AI tanımını izleyen ilk çok dilli LLM’lerden biri ve geliştiricileri eğitim veri seti, veri hazırlama kodu ve model ağırlıklarının tamamının açık lisansla sunulduğunu belirtiyor
    • “Nasıl yapıldığını tamamen inceleyememek, özgün eğitim veri setini düzenleyememek ve canın istediğinde sıfırdan yeniden oluşturamamak” sözünde doğru olan kısım, “açık” diye pazarlanan modellerin hepsinin veri, eğitim süreci vb. konularda gerçekten şeffaf ve açık olmaması. En iyisi bunun yeniden üretilebilirlik düzeyine kadar çıkması
      Sıfırdan eğitmenin çok pahalı olduğu da doğru. Ama o zaman Linux çekirdeğini kullanmaya da “yetiştirilmiş bağımlılık” mı diyeceğiz, diye merak ediyorum. Çünkü aynı çekinceler orada da geçerli
  • “AI, iş, eğitim, bilim, yazılım, yaratıcılık, kamu hizmetleri ve ulusal kapasite için medeniyet altyapısıdır” değil. Onu kontrol edenler böyle olmasını istiyor ve bunu umutsuzca zorluyor, ama gerçekte öyle değil

  • Düşünmeyi, çok kaynak tüketen, telif ihlali yapan ve halüsinasyon gören makinelere dış kaynak olarak vermeyin yeter 😘
    Elbette bu gücü birkaç dev şirketin elinde yoğunlaştırmamak, bugünkü AI’nin büyük sorunlarından birini çözer; ama diğer sorunların hiçbirini çözmez

    • “Çok kaynak tüketiyor” sözü, frontier modellerin eğitimi ya da yüz milyonlarca insanın frontier modelleri kullanması söz konusu olduğunda doğru. Ama yerel AI için bunu söylüyorsanız ya hesabı yanlış yapıyorsunuzdur ya da oldukça uç bir çevrecilik pozisyonu savunuyorsunuzdur
      Fiilen işe yarayan en küçük yerel kodlama ajanı Qwen3.6 27B ve güç sınırı uygulanmış bir NVIDIA kartında aralıklı olarak yaklaşık 280~300W ile gayet rahat çalışıyor. Bir günlük kodlama için harcadığı elektrik, masaüstü bir gaming makinesinde birkaç saat Subnautica 2 oynamaktan daha az olurdu. Bunun nedeni kısmen küçük modellerle düşünmeyi çok fazla dış kaynaklaştıramamanız; yani AI dinlenirken insanın düşündüğü zaman daha fazla oluyor
      Eğitim maliyeti daha yüksek, ama yılda yalnızca birkaç tane 27B ölçeğinde model eğitmek istiyorsanız bu, sanayi uygarlığının bütünü içinde kaybolur gider. Daha önce kabaca hesapladığımda, İzlanda’da jeotermal enerjiyle çalışan bir alüminyum eritme tesisine bir tane daha eklemek, birkaç 27B sınıfı modeli rahatlıkla eğitmeye yeter gibi görünüyordu. Bedava değil ama yuvarlama hatasına yakın
      Çıkarım sırasındaki güç tüketimi üç akkor ampulden daha az ve o da yalnızca model gerçekten üretim yaparken. Eğitim sırasındaki güç tüketimi tek bir büyük sanayi tesisi seviyesinde, ama bunun neredeyse tamamı yenilenebilir enerjiyle de yapılabilir. İzlanda bu açıdan iyi
      “Telif ihlali” iddiası, mevcut ABD içtihadına göre şu anda pek doğru görünmüyor ve telif yetkilerini daha da büyütme konusunda temkinli olmak gerekir. 90’lardan beri telif genişlemesine karşı olduğum için, LLM eğitiminin nasıl yapıldığını beğenmesem de bu mesele artık telif hukukunun alanından çıkıp siyaset ve yasama alanına kaymış gibi duruyor. Yine de Anthropic’in kitapları düpedüz korsanlaması bunun istisnası
      Ama düşünmeyi dış kaynaklaştırma sorunu hızla berbat bir hâl alıyor. Birçok insan kendini makine tanrısının et kuklasına çevirmeye çalışıyor ve bu korkutucu
    • Telif ihlali, LLM’lerin ve AI şirketlerinin kötü olmasının nedeni olarak sık sık anılıyor ama bu başlık etrafında toplanmanın tali bir yola sapmak olduğunu düşünüyorum
      Bu, cinayetin kötü olma nedenini “yasadışı olduğu için” diye açıklamaya benziyor. Cinayet kötüdür, evet, ama kötü olmasının nedeni yasadışılığı değildir. Yasalar değişebilir. AI’nin telif yüzünden kötü olduğu fikri etrafında bir akım oluşturup sonra meclis bunu yasallaştırırsa, herkes bir anda AI’yi kabul edilebilir mi sayacak? Asıl kaygının merkezine daha yakın başka itirazlar vardı ve onların etrafında toplanmak daha üretken olabilirdi
      Alexandra Elbakyan da bir telif ihlalcisi. Ama kendisi bir yetişkin ve her üniversitede heykeli olmalı
  • Gerçekten açık ve adil bir makine öğrenimi ve büyük dil modeli geleceği, tüm tedarik zinciri hesaba katılmadan mümkün değil. https://time.com/6247678/openai-chatgpt-kenya-workers/ okunmasını tavsiye ederim

  • Yakında veri zirvesine ulaşacağız ve bundan sonraki gelişmelerin büyük kısmı muhtemelen en güncel LLM’leri ajanvari şekilde paketleyip birlikte kullanmaktan gelecek
    Kamuya açık olarak yayımlanan son açık kaynak modelin, önümüzdeki yıllar boyunca sürekli değişen açık kaynak ajan tabanlı ya da başka üstyapıların temeli olarak kullanılması muhtemel

  • Daha doğrusu, halkın son 20 yılda, özellikle de yakın dönemde, büyük teknoloji şirketlerinin aldığı muazzam kamu fonunu fark etmesi ve vergilerle finanse edilen altyapı üzerindeki hakkını talep etmesi gerekiyor
    Bu şirketler, devasa kamu kaynakları aktarımı olmadan ne var olabilirlerdi ne de bugün varlıklarını sürdürebilirlerdi. Üstelik eğitim verisinin de önemli bir kısmı doğrudan kamusal ortak havuzlardan alındı
    Bu modeller özel çabanın ürünü değil, devasa bir kolektif emeğin nihai sonucu ve hukuken kamusal müşterek olarak tanınmalılar

  • Önemli olsun ya da olmasın, balon olsun ya da olmasın, halüsinasyon gören token tahminleyicileri olsun ya da olmasın, tüm ülkelerin “Frontier lab”leri en yeni model dışındaki modelleri açık kaynak olarak yayımlamaya zorlayacak bir hukuki çerçeveye sahip olması çok önemli
    Açıklanacak kapsamın içinde ağırlıklar, eğitim verisi, metodoloji vb. yer almalı; ya da her modelin 10~15 yıl sonra açık kaynak hâline gelmesi zorunlu tutulmalı. İnsan bilgisinin ilerlemesi ve “sahip olanlar” ile “olmayanlar” arasındaki ayrımın önlenmesi için, tüm modeller belli bir sürenin ardından kamunun erişimine açılmalı
    AGI’nin yakın olmadığını düşünüyor olabilirsiniz, ama bu frontier laboratuvarlarının niyeti AGI’ye ilk ulaşan olmak ve sonra onu ücretli bir duvarın arkasında tek başına tutmak. Olasılığı yüksek ya da düşük olsun, insanlığın bütünü yararına bunun engellenmesi gerekir

 
GN⁺ 4 시간 전
Hacker News görüşleri
  • Bir süredir, gönüllü katkı yapan makinelerle bir dağıtık model eğitimi sistemi kurmayı düşünüyorduk, ancak pratikte zorluk seviyesi astronomik derecede yüksek.
    İletişim hızı kaldırmıyor ve güvenilmez düğümlerden gelen veri kirlenmesi de sorun.
    İkincisi, kirlenmiş verinin ardından gelen tüm sonuçları çöpe atmak zorunda bırakmayan kendi kendini iyileştiren checkpoint rollback sistemiyle neredeyse çözülebilir gibi görünüyor, ama bu bir kişinin sadece fikirle yapabileceği küçük bir proje değil.
    Eğer artık tüm frontier araştırma laboratuvarlarının ek ilerleme kaydetmesi yasaklanacak bir durumdaysak, böyle bir yöne ilgi doğabilir.
    Dünya üzerindeki tüm GPU’ların toplamı onların kapasitesini aşardı, ama bunu verimli biçimde dağıtık kullanmanın bir yoluna ihtiyaç var.
    Fable’ı onlar kadar hızlı eğitemesek bile, bir gün erişebilir olmak hiç erişememekten iyidir.

    • Bunu daha önce başka bir yanıtta da yazmıştım ama, iyi bir fikir olsa da gerçekte işlemesi zor.
      AI’ye özel donanım, tüketici GPU’larından yalnızca çok daha hızlı değil, aynı zamanda enerji verimliliği çok daha iyi ve bağlantı kabiliyeti de çok daha üstün; bu üç eksenin her biri tek başına bu fikri çökertiyor.
      Enerji verimliliği farkı o kadar büyük ki, dünyadaki tüm açık GPU’ları ya da benzer cihazları toplasanız bile elektrik faturası aşırı yükselir ve o parayla kendi veri merkezinizi kurmak toplam maliyet açısından daha ucuza gelebilir.
      Elektrik bedava olsa bile, dünyaya dağılmış GPU’ları internet gecikmesiyle birbirine bağlarsanız binlerce ila milyonlarca kat daha yavaş olur ve bunun mümkün olup olmadığı da belirsiz.
      Her hâlükârda bu on yıl içinde fable-oss elde etmek zor ve belki bu yüzyılda bile mümkün olmayabilir.
      Hükümetlerin, ister ittifak biçiminde olsun, veri merkezlerini doğrudan satın alıp sahip olarak kamu yararı için işletmesi daha iyi olur; hatta bence gerçekten böyle yapılmalı.
    • İnsanlar dağıtık eğitim dediğinde, önce aynı şirketin sahip olduğu dev veri merkezlerinin uzun mesafeler üzerinden model eğitmesini hayal etmiyor.
      Bunun yerine, binlerce küçük veri merkezinin ya da bireysel kullanıcıların internet üzerinden boşta kalan hesaplama gücünü bir araya getirip tek bir aktörünkünden daha büyük bir eğitim çalışmasını koordine etmesini düşünüyorlar.
      Pluralis Research, Prime Intellect ve Nous Research gibi şirketler bu vizyonun peşinden gidiyor ve şimdiden anlamlı ölçekte dağıtık eğitimde başarı sağladılar, ancak internet tabanlı dağıtık eğitim hâlâ merkezi eğitimden çok geride.
      En büyük modeller olan Pluralis’in 8B Protocol Model’i, Prime Intellect’in INTELLECT-1’i ve Nous’un Consilience 40B’si bile xAI’nin Grok 4 gibi güncel frontier modellerinden 1.000 kat daha az hesaplama ile eğitildi.
      https://epoch.ai/gradient-updates/how-far-can-decentralized-...
    • Dünya üzerindeki tüm GPU’ların toplamının onların kapasitesini aşacağı doğru değil.
      Ne kadar çok silikonun tam da bu şirketlere gittiği ve bu silikonun tüketici ekipmanına kıyasla ne kadar güçlü olduğu yanlış anlaşılıyor.
    • Birkaç yıl önce, P2P ile bu hedefin bir kısmına ulaşmaya çalışan Petals adlı bir proje vardı: https://github.com/bigscience-workshop/petals
      BLOOM modeli de işbirliğiyle ortaya çıkan bir sonuçtu: https://huggingface.co/docs/transformers/en/model_doc/bloom
    • Uygun teknikler kullanılırsa gradient bilgisi 10000 kat sıkıştırılabilir, bu yüzden bunun mümkün olduğunu düşünüyorum.
      Nous bunu zaten başardığını iddia ediyor: https://github.com/NousResearch/DisTrO
      Geçmişte de yüksek sıkıştırma oranları bildiren gradient sıkıştırma makaleleri vardı.
  • Buna ek olarak dağıtık LLM çıkarımı da gerekli.
    Artık tek bir kişinin en yeni modeli çalıştıracak donanımı kurmasının fazla pahalı olduğu noktaya geldik.
    Bu yüzden bireylerin kaynaklarını paylaşarak en yeni modeli dağıtık biçimde çalıştırabilmesini sağlayacak bir framework oluşturup benimsemeliyiz.
    Böylece hükümetlerin sansür uygulaması da zorlaşır.
    Bunu tek bir aktörün silaha dönüştürmesini engellemenin tek yolu, herkese erişim vermektir.

    • Yerelde çalışan küçük LLM’lerin birbirini tamamlayıp, toplamda çok daha iyi performans veren bir LLM oluşturmasının bir yolu olup olmadığını merak ediyorum.
    • Teale.com’u yaptım ve açık kaynak olarak yayımladım.
      Mac, Windows, Linux, Android, iOS, hatta HarmonyOS üzerinde tamamen dağıtık çıkarım çalıştırıyor.
      Açık kaynak/açık ağırlıklı modeller gelişmeye devam edecek ve sonunda akıllı telefon ya da gözlük donanımında bile mythos seviyesinde bir şey çalışacak.
      Ancak şu anda arz ve talebi eşleştirmek korkunç derecede zahmetli.
      Örneğin 16GB RAM’li bir MacBook fiziksel olarak gerçekten 16GB’ın tamamını kullanabiliyor demek değil; ayrıca model ve ayarları (kvcache, context limit, temperature vb.) taleple eşleştirme sorunu da var.
      İnsanlar tarafından, insanlar için yapay zeka çıkarımına ihtiyaç var; yardım memnuniyetle karşılanır.
    • Model dağıtılmışsa, model katmanları arasındaki veri aktarımı düşünüldüğünde dağıtık LLM çıkarımı çok verimsiz görünüyor.
      Petals adlı bir proje 180B modelde en fazla 4 tok/s iddia etmişti ama depo 2 yıldır güncellenmiyor.
      https://petals.dev/
    • Bunu tek bir aktörün silaha dönüştürmesini engellemenin tek yolunun herkese erişim vermek olduğu iddiasının bir orta yolu var.
      Politika alanında, hükümetin hem erişimi hem de tekelleşmeyi düzenlediği yaklaşımlar da bulunur.
      Bu teknolojinin tekel altında olmasına karşıyım, ancak herkese jailbreak yapılmış AGI/ASI vermenin riskleri de açık olmalı.
      Oyuncak bir örnek olarak, hükümetin birden fazla laboratuvara (n_quorum) taşeronluk verip herkese token bütçesi sağladığı bir evrensel temel yapay zeka düşünülebilir.
      Ancak API işletiminde güvenlik kontrolleri bulunmalı.
      Herkes kendi jailbreak edilmiş AGI’sini çalıştırırsa, istikrarlı toplumsal normlar için geriye yalnızca kimin CBRNE tehdidi ürettiğini izleyen kitlesel gözetim kalıyor gibi görünüyor.
      Bu, sivil özgürlükler açısından net bir zafer gibi görünmüyor, ama böyle bir mantığın kurulabildiğini anlıyorum.
  • Kendi evimde ve işimde en başından beri kazandı
    Daha doğrusu açık ağırlıklar kazandı; bu ince fark ise rahatsız edici geliyor
    Bir ürünün çalışmasını ya da geliştirilmesini, kârlılığı da belirsiz ve iç yüzü bilinmeyen iki büyük startup’tan birinin gizli kaynağına tamamen bağımlı hâle getiren yaklaşımı hiç anlayamadım
    Bu, sağlıklı mühendislik ilkelerine de aykırı
    Bu yüzden böyle yapma niyetim hiç olmadı; bugün AI’ı araştırmamın nedeni de açık ağırlıklar sayesinde buna zaman ayırmaya değeceğine karar vermiş olmam
    Zaten işletmeler çoğu zaman tek bir ödeme platformunun ve iki ABD kredi kartı sağlayıcısının politikalarına bağımlı oluyor; bu bile fazlasıyla kötü
    Belki serbest çalışan mizacım yüzündendir ama temel teknolojiyi değil de bir başkasının ürününü inceleyip öğrenmeye gereğinden fazla enerji harcamam beklendiğinde hep tedirgin oluyorum
    Microsoft’un, NT kaynak koduna erişim vaadiyle bölümleri ikna etmeye çalıştığı dönemi de hatırlıyorum
    O sırada bizim taraftaki üst düzey birinin, Linux’un tali bir şey olduğunu ve NT erişiminin bizi anlamlı kılacağını söylediğini de hatırlıyorum
    Kendi kaderi üzerindeki kontrol her zaman daha fazla olmalı; ayrıca öncü uç teknolojinin en güncel istikrarlı teknolojinin ilerisinde olduğunu kendime ve çevreme hatırlatıyorum
    İlerleme öncü uçta olur ama hasar riski de vardır
    Mühendislik, başkasının ilerlemesinin üstüne binmeye değil, en güncel istikrarlı teknoloji üzerine inşa etmeye odaklanmalıdır

    • Bu bağlamda açık kaynak ifadesinde rahatsız edici bir incelik var
      llama.cpp gibi araçlar açık, ama ağırlıklar olmadan işe yaramıyorlar
      Ağırlıklar, birbiriyle savaş hâlindeki büyük kurumların bağışladığı son derece pahalı bir sermaye
      Örneğin archive.org’un gerçekten açık ağırlıklar üretebileceğini bilmiyorum; archive.org dışında da freebsd ya da apache gibi başka açık kaynak kuruluşlarının gerçekten açık ağırlıklar üretebilecek konumda olduğunu hayal etmek zor
      Mümkünse belki hükümetler, devlet kurumları ve üniversiteler olabilir
      Ama bugün bu kurumların, ağırlık üretmek için gereken altyapıya para akıtacak kadar finansmanı, yetkisi, iradesi ya da ilgisi yok
    • Ben ise ilginç biçimde başka bir yaklaşım benimsedim
      AI, işimizdeki geliştirme biçimini tamamlıyor ve mühendisler en iyi açık kaynak modellerden ziyade Opus 4.8 kullanmayı çok daha fazla tercih ediyor
      Açık kaynağın önemli olduğuna inanıyorum ama kendi işimde kullanılabilecek en iyi araçları doğrudan kullanacağım
  • Açık kaynak ücretsiz yazılım anlamına gelmeye başladığında, bu fiilen ücretsiz bir kopya istemekle aynı kapıya çıkıyor
    Söylememiz gereken şey, kamusal ve topluluk tarafından işletilen projelerin birlikte ön eğitim ve eğitim yapması gerektiği
    Bu, eğitim derleminin kamusal biçimde ele alınması ve eğitim işinin bir şekilde koordine edilmesi anlamına geliyor
    Bu, terimin anlamını tamamen değiştirmek olur; insanların korsanlık ile hırsızlığı birbirine karıştırmasına benziyor
    Bunlar farklı şeyler, dolayısıyla farklı kelimeler kullanmalıyız
    Ücretsiz ağırlıklar, çıkarım kodu ve sohbet şablonları, topluluk tarafından işletilen LLM projelerinden çok farklı

    • EleutherAI buna yakın bir şey olabilir
  • Buna kim finansman sağlayacak?
    Eğitim maliyetleri hayal etmesi zor ölçüde pahalı
    Ya yatırım getirisi peşindeki VC finansman modeli var ya da otoriter Çin toplumsal modelini sağlamlaştırmayı amaçlayan CCP finansman modeli
    Üniversitelerin 4B ölçeğinde modelleri olabilir ama çok ileri gidebilecek gibi görünmüyor

    • Bu kaygıya katılıyorum ama bugün de benzer ölçüde büyük ve karmaşık şeyler açık kaynak olarak varlığını sürdürüyor
      Linux bilgisayarımın, trilyon dolarlık iki şirketin yaptığı işletim sistemleriyle neredeyse aynı deneyimi sunmasına her gün şaşırıyorum
      Hatta o ticari alternatiflerin yapamadığı şeyleri bile yapıyor
      Eğer DeepSeek gerçekten Batılı rakiplerinin maliyetinin 1/10’una ve personel sayısının yalnızca bir kısmıyla model çıkarabiliyorsa, bu alanda alternatif sunacak biri için bir pazar olduğu anlamına gelebilir
      IBM gibi şirketlerin neden Linux’a isteyerek katkıda bulunduğunu ve bu katkıları ücretsiz sunduğunu düşünüyorum
      Çünkü piyasadaki daha baskın ticari oyuncuya karşı bir alternatife ihtiyaç duyan kurumsal sponsorlar topluluğunun parçasılar
      Meta’nın React’i fiilen ücretsiz sunmasının nedeni de benzer
      Bir standart hâline gelmesi ve zaten bilen insanları işe alabilmesi Meta için daha avantajlı
      AI modellerinde aynı ekosistem faydasını hayal etmek daha zor ama bir yerlerde olabilir
      Veri merkezi/VPS sağlayıcılarının, büyük AI şirketlerinin pazarlık gücünü azaltmak için böyle bir şeyi desteklediğini hayal etmek mümkün
      Elbette bu iyimserlik boş bir hayal de olabilir
    • Model damıtmanın yasal bir faaliyet olduğuna dair hukuki bir emsale gerçekten ihtiyaç var
      Model üreticileri başkalarının çalışmalarını kazıyıp onunla eğitim yapabiliyor ve bilgiyi kendilerine aitmiş gibi aklayıp asıl yaratıcıya geri bir şey vermek zorunda kalmıyorsa, model damıtmanın neden yasa dışı olması gerektiğini anlayamıyorum
      Bu, frontier model üreticilerinin genel olarak başkalarının fikri mülkiyetine yaptığı şeyle aynı
    • 1960’lardaki bilgisayar maliyetlerini enflasyona göre hesaplamayı hiç denedin mi?
      Eğitim bugün hayal etmesi güç olacak kadar pahalı
      Ya birkaç üniversite parasını birleştirirse?
      Ya birkaç ülke parasını birleştirirse?
      Sonunda bir atılım olacak ve optimizasyonlar gerçekleşecek
      İnsanlar açık kaynak bir işletim sisteminin uygulanabilir olup olmayacağından şüphe ediyordu ama Linux, onlarca yıldır masaüstü ortamlarında fiilî bir seçenek oldu; sunucu ve telefon işletim sistemi olarak ne kadar yaygın kullanıldığını söylemeye bile gerek yok
    • Sadece pahalı değil, aynı zamanda israfçı da
      Eski modelleri kullanmanın bir değeri yok
      Açık kaynak AI manifestosu “açık kaynak AI ekonomik olarak da sürdürülebilir olmalı” diyor ama bu daha çok temennili düşünceye benziyor
    • Kapalı model çıkaran laboratuvarların açık kaynak modeli de birlikte yayımlaması gibi bir yaklaşım belki mümkün olabilir
      gpt-oss artık eski ama çıktığı zaman fena değildi
      Nemotron da sağlam; özellikle son ultra sürümü iyi
      Nvidia’nın hikâyesi özellikle Çin modelleriyle karşılaştırıldığında çok daha güçlü; çünkü yalnızca modelin kendisini değil, ön/son eğitim verileri dâhil her şeyi yayımlıyor
  • Kurumsal yan ürün olarak açık kaynak modeller elde etmektense, açık kaynak bir AI laboratuvarını desteklemek için ayda 50 dolar ödemeye fazlasıyla razıyım

    • AI laboratuvarları yüz milyarlarca dolar harcıyor; rekabet etmek için çok ama çok sayıda abone gerekir
    • Bence OpenAI güveni mahvetti
      O açık kaynak AI laboratuvarının bir şekilde kâr amaçlı bir şirkete dönüşmeyeceğini nereden bilebiliriz?
    • Bildiğim kadarıyla DeepSeek’in kapalı modeli yok ve çoğundan daha fazla kod/veri/makale yayımlıyor
      Belki onların API’sini kullanmaya başlamalıyım
      O da kurumsal bir yan ürün değil
  • Açık ağırlıklı yapay zekada, eğitime ve araştırmaya büyük sermaye yatırmak için güçlü bir teşvik olmayabilir
    Bağış fonları gibi şeyler ortaya çıkabilir, ama bunun frontier laboratuvarlarının aldığı finansman düzeyine yaklaşması doğal olarak zor olur
    Bu yüzden yapay zekanın yalnızca açık ağırlıklarla var olması mümkün olmayabilir diye düşünüyorum
    OpenAI, Anthropic, Google gibi başlıca oyuncular varlığını sürdürür ve açık kaynak sürümlerden daha iyi modellere sahip olma ihtimalleri yüksektir
    Bu, Photoshop ile GIMP arasındaki ilişki gibi görünebilir
    Photoshop frontier laboratuvarlarını, GIMP ise açık ağırlıklı modelleri temsil eder
    GIMP, çeşitli görsel düzenleme iş akışlarında kullanmak için yeterince iyidir, ama Photoshop basitçe daha iyidir
    Frontier laboratuvarlarından daha iyi açık ağırlıklı modeller olsa elbette güzel olurdu, ama bunun mümkün olduğunu sanmıyorum

    • Ben de benzer düşünüyorum, ancak açık kaynak model olmasa bile yerel yapay zekanın sonuçta kaçınılmaz olacağını düşünüyorum
      OpenAI ve benzerleri de on-premise ürünler sunabilir
      Bu ister appliance rack ister başka bir formda olsun, büyük şirketler veri egemenliği ve maliyet kontrolü için çıkarımı yerelde çalıştırmak isteyecektir
      Özellikle üretim sanayisinde veya diğer ağdan yalıtılmış ağlara yapay zekayı entegre etme zamanı geldiğinde bu daha da geçerli olur
    • Photoshop ve GIMP benzetmesi oldukça iyi
      Şu an bir tür hızlı ölçeklenme aşamasındayız, ama yapay zekanın arkasındaki teknoloji gerçekten evrim geçirmezse giderek daha iyi modeller üretmek zorlaşacak ve azalan getiri görülecek
      LLM dünyasının GIMP'i, VC fonlu modelin performansının %80'ini bile verirse birçok insan için fazlasıyla yararlı olacaktır
      Özel mülkiyetli modeller kadar iyi olmadığı doğru olsa bile, açık kaynak modeli kullanma seçeneğinin olması bile bence bir zaferdir
    • Bir adım geri çekilip bakarsanız bu sadece zaman meselesi
      Tüketicilerden trilyonlarca dolar çekip çıkarmanın imkansız olduğu ortaya çıktığında, trilyon dolarlık değerlemeler anlamsız görülecektir
      Bu arada ve her halükarda, yazılım optimizasyonu ve donanım ölçeklenmesi sürerse çok geçmeden mobil cihazlarda Fable'dan daha üstün yeteneklere sahip açık ağırlıklı modeller çalışacaktır
    • Kullanıcıların folding@home benzeri şekilde eğitime hesaplama gücü bağışlamasının bir yolu olsaydı, bu belki mümkün olabilirdi
      Yine de bunun pratikte nasıl işleyeceğini bilmiyorum
    • Yapay zekanın yalnızca açık ağırlıklarla var olmasının zor olmasının daha temel bir nedeni var
      Bazı yapay zeka modelleri o kadar büyük ki, makul şekilde çalıştırılmaları ancak en ileri hiper ölçekli veri merkezlerinde mümkün
      Böyle modelleri açık kaynak olarak yayımlamak çoğu durumda anlamsız olur
      Bu, bugün kamuya açık en büyük modellerden bile çok daha büyük ölçek demek; küçük ve ucuz geçici kümelerde yavaş çıkarım yapmayı bile dışlayan bir seviye
      Fable zaten o noktada olabilir
  • Duyguya ve misyona katılıyorum, ama bu hedef artık siyasetten ayrı düşünülemez
    Open Source(tm), devletin ya da başka aktörlerin silikon üzerinde veya o silikonun yapabilecekleri üzerinde kontrol kurmasını engelleyemez; nitekim bu zaten dünya genelinde yaşanıyor
    Model açık kaynak olsa bile düzenlemeleri veya ekonomik teşvikleri çözmez
    Bu, birkaç paragrafa sıkıştırılabilecek bir mesele değil
    Yapay zeka medeniyet ölçeğinde bir altyapıdır ve sadece kaynak kodu değil, medeniyet ölçeğinde çözümler gerektirir

    • Tekelci kapitalizm ve finans kapitalizmi piyasaya yüz yıldan uzun süredir hakim ve devlet bu devasa çıkar çevrelerine hizmet ediyor
      Herkes yapay zeka şirketlerinin eğitim için izinsiz şekilde veri aldığını biliyor, ama hiçbir şey olmayacak
      Bu, hukukun sınıfsal uygulanışının açık bir örneği
      Kendi yasalarını keyfî biçimde uygulamalarının gerekçesi her zaman ulusal güvenlik olacaktır
      Altyapıya onlar sahip olduğu için, onların çıkarı ulusal güvenlik sayılacaktır
      Teknoloji her büyük sıçrayış yaptığında dengeyi sarsabilir, ama finans kapitalizmi hızla uyum sağlayıp o dalgayı emer
  • Yazıda ele alınmadıysa, açık kaynak ile açık ağırlık arasındaki ayrım önemlidir
    Açık ağırlıklı modeller neredeyse ilk doz bedava verilen bir giriş uyuşturucusu gibidir
    En azından özgün eğitim verisi olmadan anlamlı yükseltmeler yapma kabiliyeti çok sınırlıdır; bu yüzden sürekli geliştirilen son teknoloji modellerin gerisinde hızla kalırlar
    Sonra ya bir sonraki yayını beklersiniz ya da sağlayıcının API'sine geri dönersiniz
    Sadece bilgi kesim tarihini ileri taşımak bile kullanıcı deneyimini gözle görülür biçimde iyileştirir; çıkarım, quantization-aware training ve ileride gelecek diğer pek çok iyileştirmeden bahsetmiyorum bile
    Açık ağırlıklı modelleri iyileştirmeye yönelik araştırmalar yapılabilir, ama sonuç aynıdır
    Açık kaynak değilse, genel halka sağladığı fayda çok daha küçük olur

  • Açık kaynak yapay zeka tanımı gereği asla kazanamaz
    Günümüzde yapay zeka sonuçta tepe tırmanma optimizasyonuna yakın ve kapalı laboratuvarlar açık dünyanın yaptığı her şeyi emip onun üstüne daha fazlasını koyabilir
    Çoğu kullanım senaryosunda bu büyük bir sorun değil, çünkü yapay zeka yetenek doygunluğu şeklinde çalışıyor
    https://www.delanceyukschoolschesschallenge.com/the-rising-t...
    İstisna yalnızca doğa ya da başka insanlarla özünde karşı karşıya olunan alanlar gibi, rekabete göre üstünlüğün önemli olduğu durumlardır

    • Yaygın işlerde yetenek doygunluğuna ulaşıldığında kazanan açık kaynak olur ve bu zaten olmaya başladı
      İkinci büyük zafer muhtemelen sıradan insanların bunu kendi donanımlarında çalıştırabildiği an olacaktır
    • Linux için de aynı şey söylenebilirdi
      Microsoft Linux'tan istediği kadar öğrenebilirdi ama Linux, ticari rakiplerine rağmen yalnızca alakalı kalmakla yetinmedi; Firefox'un bugünkü pazar payı gibi örneklerin aksine artık ezici farkla en yaygın işletim sistemi oldu
      Açık sistemlerden tüm iyi fikirleri ya da verileri emebilme yeteneği tek belirleyici etken değil gibi görünüyor
    • Kapalı laboratuvarlar da hâlâ yatırımı gerekçelendirmek zorunda ve model yetenekleri durağanlığa yaklaştıkça bu giderek zorlaşıyor
      Şu anda Fable ve Mythos en ileri seviyede ama yakında metalaşacaklar
      OpenAI/Anthropic gibi en yeni modellerle önde gitmeye çalışan her bir şirkete karşılık, onun tamamlayıcılarını metalaştırmaya çalışan yaklaşık yüz şirket olacaktır
    • AllegroLisp, SBCL'nin epey gerisinde
    • Açık kaynak bir modelin Claude Mythos ya da Claude Sonnet kadar iyi olması gerekmiyor ki kazansın
      Açık kaynağın zaferi, kapalı modellere alternatiflerden en az birinin GPT-4 kadar iyi olması anlamına gelirse yeterlidir
      Aslında Google Gemma modelleriyle neredeyse zaten o noktaya geldik
      Bir yazılım mühendisi olarak Sonnet'ten sonrasında üretkenliğimde bir fark hissetmedim
      Elbette Opus daha iyi ve Fable daha da iyi olabilir ama ekonomik değer açısından bakınca zaten azalan getiriye çarpmış durumdayız
      Cursor'da ilk GPT modellerinden birini kullanırken Claude Code ve Sonnet'e geçtiğimde benim için neredeyse 5 kat üretkenlik artışı oldu
      Claude Code'dan önce yapay zekayı yalnızca küçük kod parçaları için kullanıyordum ama Claude Code + Sonnet ile bütün alt görevleri devredebilir hale geldim
      Yine de bir özelliğin tamamını baştan sona Opus'a bırakacak kadar güvenmiyorum
      Bir gün bunun mümkün olacağından da emin değilim ve bunun mutlaka gerekli olması da gerekmeyebilir
      Şirketler yazılım mühendislerinden belirli ölçüde yüksek yetenek bekler ama o seviyenin ötesine geçince gerçekten hiç umursamazlar
      Fark büyük olsa bile bunu fark etmezler