11 puan yazan GN⁺ 4 시간 전 | 2 yorum | WhatsApp'ta paylaş
  • Çin'in önde gelen yapay zeka laboratuvarlarını bizzat ziyaret edip araştırmacılarla konuşma deneyimine dayanan, Çin-ABD yapay zeka ekosistemleri arasındaki kültürel farkları ve bunun model geliştirme üzerindeki etkilerini inceleyen saha notları
  • Çinli araştırmacılar, bireysel şöhretten çok nihai modelin kalitesini optimize etmeye odaklanan bir kültürel eğilim sergiliyor; temel katkı yapanların önemli bir bölümü hâlâ öğrenci
  • Çinli yapay zeka şirketleri, dış hizmet satın almaktansa kendi teknoloji yığınlarını kontrol etmeye çalışan güçlü bir sahiplik anlayışına sahip; açık kaynak yayınlama da pratik değerlendirmelere dayanıyor
  • Çin'deki yapay zeka geliştiricilerinin çoğu Claude kullanıyor ve kurumsal yapay zeka talebinin SaaS değil bulut pazarının izlediği rotayı takip etmesi mümkün görünüyor
  • ABD ve Çin'in yapay zeka ekosistemleri yapısal olarak farklı biçimlerde işliyor; Batılı çerçevelerle Çin yapay zeka sektörünü basitçe eşlemek kategori hatasına yol açabilir

Çinli araştırmacıların düşünme tarzı

  • Çin'deki LLM geliştiren şirketler, eğitim ve iş hayatındaki uzun kültürel geleneklerle teknoloji şirketi işletmenin ince farklarını birleştirerek hızlı takipçi (fast-follower) olmak için çok uygun bir yapıya sahip
  • En güncel LLM'leri inşa etmekte veri, mimari ayrıntılar, RL algoritma uygulamaları gibi tüm yığına yayılan ince işçilik kritik önemde; bu da bireysel katkıların, modelin çok amaçlı genel optimizasyonu için geri planda kalmasını gerektiren karmaşık bir süreç
  • ABD'li araştırmacılarda kendi işlerini aktif biçimde öne çıkarma kültürü güçlü ve "öncü yapay zeka bilim insanı" olarak ün kazanma arzusu kurum içinde çatışma yaratıyor
    • Llama organizasyonunun bu tür politik çıkarların ağırlığı altında çöktüğüne dair söylentiler yaygın
    • Bazı laboratuvarlarda, fikirlerinin nihai modele yansımamış olmasından şikâyet eden üst düzey araştırmacılara ödeme yapılması gerektiğine dair anlatılar da var
  • Çin laboratuvarlarındaki temel katkı sahiplerinin önemli bir bölümü halen öğrenci ve laboratuvarların kendisi de çok genç organizasyonlar
    • Bu, öğrencilerin akran olarak görüldüğü ve doğrudan LLM ekiplerine entegre edildiği Ai2 yapısına benziyor
    • Buna karşılık ABD'de OpenAI, Anthropic, Cursor gibi şirketler staj imkânı sunmuyor; Google'ın Gemini ile ilgili stajlarında da gerçek işten kopuk kalma riski var
  • Bu kültürel farkların model inşa etme kabiliyetini geliştiren somut yönleri:
    • Nihai modeli iyileştirmek için öne çıkmayan işlere yüksek kabul
    • Yapay zekaya yeni girenlerin önceki hype döngülerine takılmamış olması nedeniyle modern tekniklere daha hızlı uyum
    • Daha az ego sayesinde organizasyon yapısının biraz daha ölçeklenebilir olması ve sistemi oyunlaştırmanın daha az görülmesi
    • Başka yerlerde kavramsal olarak kanıtlanmış sorunları çözmeye uygun geniş bir yetenek havuzu
  • Bu avantajlar, Çinli araştırmacıların yaratıcı ve alan açan 0'dan 1'e tarzı akademik araştırmaları daha az ürettiğine dair bilinen klişeyle tezat oluşturuyor
    • Akademik laboratuvar liderleri daha iddialı bir araştırma kültürü yetiştirmeye çalışıyor
    • Bazı teknik liderler, eğitim ve teşvik sistemini yeniden tasarlamanın mevcut ekonomik denge içinde fazla büyük bir görev olduğu görüşünde ve buna şüpheyle yaklaşıyor

Öğrenci araştırmacıların özellikleri

  • Çin'de de ABD'dekine benzer bir beyin göçü yaşanıyor; daha önce akademiyi düşünen pek çok kişi artık sanayide kalmaya eğilimli
    • Bir araştırmacı profesörlüğe ilgi duyduğunu, ancak "eğitim LLM'lerle çözülüyor — öğrenci neden bana soru sorsun ki" dediğini aktardı
  • Öğrenciler, LLM'lere önyargısız yaklaşma avantajına sahip
    • Son birkaç yılda LLM'lerin temel paradigması MoE ölçekleme → RL ölçekleme → ajan kullanımı yönünde değişti
    • Bunların hepsini iyi yapmak için geniş literatürü ve teknoloji yığını bağlamını hızla özümsemek gerekiyor; öğrenciler bu işe alışkın ve hevesli
  • Çinli öğrenci araştırmacılar felsefi söyleme daha az giriyor ve oldukça doğrudan davranıyor
    • Model ekonomisi ya da uzun vadeli toplumsal riskler hakkında sofistike görüşlere sahip Çinli araştırmacı sayısı, ABD'ye kıyasla çok daha az
    • Bir araştırmacı, Dan Wang'ın ünlü tezini alıntılayarak "Çin'i mühendisler yönetiyor, ABD'yi ise avukatlar yönetiyor" dedi
    • Çin'de Dwarkesh ya da Lex gibi mega ana akım podcast'ler üzerinden bilim insanlarının yıldız gücünü sistematik biçimde büyüten bir hat yok
  • Yapay zekanın doğuracağı ekonomik belirsizlikler, AGI ötesi sorular ve model davranışı üzerine ahlaki tartışmalar gibi başlıklarda Çinli bilim insanlarının yanıtları, tartışma ve toplumsal yapı üzerine fikirlerin teşvik edilmediği bir sistemde büyümüş olmalarını yansıtıyor

Pekin ve Çin yapay zeka ekosisteminin sahadaki atmosferi

  • Pekin, Bay Area'ya çok benzer hissettiriyor; rakip laboratuvarlar yürüyüş ya da kısa ulaşım mesafesinde bulunuyor
    • 36 saat içinde Z.ai, Moonshot AI, Tsinghua Üniversitesi, Meituan, Xiaomi, 01.ai ziyaret edildi
    • Didi ile ulaşım rahat ve Çin'de XL araçlar olarak çoğu zaman masaj koltuklu elektrikli minibüsler geliyor
  • Araştırmacılar için yetenek savaşı ABD'ye çok benziyor; araştırmacıların iş değiştirmesi yaygın ve seçim ölçütü çoğu zaman o anda havası en iyi olan yer
  • Çin'in LLM topluluğu, rekabet eden kabilelerden çok bir ekosistem gibi hissettiriyor
    • Tüm Çin laboratuvarları, popüler Doubao modeline sahip ByteDance'e karşı temkinli
    • ByteDance, Çin'deki tek frontier kapalı laboratuvar
    • Tüm laboratuvarlar, uygulama tarafında en iyi araştırma sezgisine sahip teknik lider olarak DeepSeek'e saygı duyuyor
    • Bu durum, ABD'de laboratuvar üyeleriyle gayriresmî biçimde buluşulduğunda hızla kıvılcım saçılan atmosfere zıt
  • Çinli araştırmacıların alçakgönüllülüğündeki en dikkat çekici unsur, iş tarafına ilişkin konuları "benim meselem değil" diyerek ilgisiz karşılamaları
    • ABD'de ise veri satıcıları, compute, finansman gibi ekosistem düzeyindeki sektör trendlerine herkes takıntılı

Çin yapay zeka sektörünün farkları ve benzerlikleri

  • Günümüzde yapay zeka modeli inşa etmek, artık sadece üstün araştırmacıların mühendislik çıktısı olmaktan çıkıp inşa etme, dağıtım, finansman ve benimsemenin birleştiği karmaşık bir faaliyet hâline geldi
  • Batı ekosistemiyle başlıca 6 fark:
  • 1. Yerel yapay zeka talebinin erken işaretleri

    • Çinli şirketlerin yazılıma para ödememesi nedeniyle büyük bir inference pazarı oluşmayacağına dair bir hipotez var
    • Ancak bu, tarihsel olarak Çin'deki çok küçük SaaS ekosistemi için geçerli; ülkede yine de büyük bir bulut pazarı bulunuyor
    • Temel çözülmemiş soru: Kurumsal yapay zeka harcamaları küçük SaaS pazarını mı, yoksa daha temel olan bulut pazarını mı takip edecek?
    • Genel olarak yapay zeka buluta daha yakın bir rota izliyor gibi görünüyor ve yeni araçların etrafında pazarın büyümesi konusunda aktif kaygı duyan kimseyle karşılaşılmadı
  • 2. Geliştiricilerin çoğu Claude kullanıyor

    • Çin'deki yapay zeka geliştiricilerinin büyük kısmı Claude'a hayran ve Claude'un yazılım geliştirme biçimini nasıl değiştirdiğine odaklanıyor
    • Claude, kâğıt üzerinde Çin'de yasaklı olmasına rağmen kullanılıyor
    • Bazı araştırmacılar Kimi ya da GLM CLI gibi kendi araçlarını kullandıklarını söylese de herkes Claude'dan söz ediyor
    • Bay Area'da popülaritesi hızla artan Codex'ten şaşırtıcı derecede az bahsedildi
    • Çin'in tarihsel olarak yazılım satın almaya isteksiz olması, inference talebinde büyük bir sıçrama olmayacağı izlenimini vermiyor
  • 3. Teknolojiye sahip olma anlayışı

    • Çin kültürü, canlı ekonomik motorla birleşince öngörülemeyen sonuçlar üretiyor
    • Çok sayıdaki yapay zeka modeli, bir ana plandan çok, birçok teknoloji şirketinin pratik ve güncel dengelerini yansıtıyor
    • Sektörde ByteDance ve Alibaba, büyük kaynakları sayesinde çoğu pazarda kazanması beklenen yerleşik oyuncular olarak görülüp saygı görüyor
    • DeepSeek saygı duyulan bir teknik lider, ancak pazar lideri olmaktan uzak; yön veriyor ama ekonomik olarak kazanacak yapıda değil
    • Meituan (teslimat hizmeti) ya da Ant Group gibi şirketlerin model geliştirmesi Batı'da şaşırtıcı gelebilir, ancak LLM'lerin geleceğin teknoloji ürünlerinin merkezinde yer alacağı düşünülüyor ve bu yüzden güçlü bir temel gerekli görülüyor
    • Genel amaçlı bir modeli fine-tune etmek, açık topluluğun geri bildirimiyle yığını güçlendirirken şirket içi ürünler için kuruma özel fine-tune sürümleri elde etmeyi mümkün kılıyor
    • "Önce açık" yaklaşımı da pratikliğe dayanıyor: modele güçlü geri bildirim almak, açık kaynak topluluğuna katkı vermek ve misyonu güçlendirmek
  • 4. Devlet desteği gerçek, ama ölçeği belirsiz

    • Çin devletinin açık LLM rekabetini aktif biçimde desteklediği sıkça öne sürülüyor
    • Ancak yönetim çok katmanlı ve merkezsiz; her seviyede tam olarak ne yapıldığına dair net bir oyun kitabı yok
    • Pekin'deki mahalleler, teknoloji şirketlerinin ofislerini çekmek için birbiriyle yarışıyor
    • Sunulan "yardım"ın neredeyse kesin biçimde izin gibi bürokratik süreçleri kolaylaştırmayı içerdiği düşünülüyor; fakat yetenek çekmeye ya da çip kaçakçılığına kadar uzanıp uzanmadığı belirsiz
    • Ziyaret sırasında devlet ilgisi ya da desteğine dair birkaç kez söz edilse de ayrıntılar, kesin yargı vermek için fazla yetersiz
    • Çin devletinin en üst düzeyde modellerin teknik kararlarını etkilediğine dair hiçbir ipucu yoktu
  • 5. Veri endüstrisi çok daha az gelişmiş

    • Anthropic ya da OpenAI'nin tek bir ortama 10 milyon doların üzerinde, yıllık ise yüz milyonlarca dolar düzeyinde harcamayla RL frontier'ını genişlettiğine dair bilgiler duyulduğundan, Çin laboratuvarlarının da ABD şirketlerinden benzer ortamları satın alıp almadığı ya da yerel ekosistemden destek alıp almadığı merak ediliyordu
    • Veri endüstrisinin tamamen yok olmasındansa nispeten düşük kaliteli olması nedeniyle, ortamları ya da veriyi şirket içinde kurmak çoğu zaman daha iyi bir seçenek
    • Araştırmacılar RL eğitim ortamlarını doğrudan kurmak için ciddi zaman harcıyor
    • ByteDance ve Alibaba gibi büyük şirketlerin bunu desteklemek üzere şirket içi veri etiketleme ekipleri var
    • Tüm bunlar, önceki maddede anlatılan satın almak yerine inşa etmek zihniyetini yansıtıyor
  • 6. Nvidia çiplerine yönelik yoğun ihtiyaç

    • Nvidia compute eğitim için altın standart ve tüm laboratuvarlar, bunun eksikliği nedeniyle ilerlemelerinin sınırlandığını söylüyor
    • Arz olsa satın alacakları açık
    • Huawei dâhil diğer hızlandırıcılar ise inference için olumlu değerlendiriliyor ve birçok laboratuvarın Huawei çiplerine erişimi var
  • Bu noktalar, Batılı laboratuvarların çalışma biçimini Çin'e hızlıca uyarlamanın kategori hatasına yol açacağı, çok farklı bir yapay zeka ekosisteminin resmini çiziyor
  • Asıl soru, bu farklı ekosistemlerin anlamlı ölçüde farklı model türleri üretip üretmeyeceği, yoksa Çin modellerinin her zaman ABD frontier modellerinin 3 ila 9 ay önceki sürümleri olarak mı tanımlanacağı

Küresel denge

  • Çin, kurallar ya da tariflerle açıklanabilecek bir yer değil; çok farklı dinamiklere ve kimyaya sahip
    • Kültürü çok eski ve çok derin; ülkedeki teknoloji inşa etme biçimiyle tamamen iç içe geçmiş durumda
  • ABD'nin mevcut güç yapısı, Çin'e dair dünya görüşünü karar almanın merkezî aracı olarak kullanıyor; ancak Çin'de Batılı karar alma modelleriyle açıklanması çok zor nitelikler ve içgüdüler var
  • Bu laboratuvarların neden en iyi modellerini açık biçimde yayımladıkları doğrudan sorulduğunda bile, sahiplik duygusu ile gerçek ekosistem desteğinin kesişimi kolayca açıklanamıyor
  • Çin'deki neredeyse tüm büyük teknoloji şirketleri kendi genel amaçlı LLM'lerini geliştiriyor
    • Meituan (teslimat hizmeti), Xiaomi (geniş tüketici teknolojileri şirketi) gibi firmalar açık ağırlıklı modeller yayımlıyor
    • ABD'deki muadilleri ise muhtemelen sadece hizmet satın alırdı
    • Bu şirketlerin LLM geliştirmesinin nedeni sıcak bir trende kapılmak değil, kendi yığınlarını kontrol etme ve çağın en önemli teknolojisini geliştirme yönündeki derin, temel arzu
  • Çinli araştırmacıların insani yönü, çekiciliği ve içten sıcaklığı çok insani bir deneyim sunuyor
    • ABD'de alışıldık olan sert jeopolitik söylem onlara hiç nüfuz etmemiş gibi görünüyor
  • Açık ekosistem küresel ölçekte gelişirse daha güvenli, daha erişilebilir ve daha faydalı yapay zeka üretmek mümkün olabilir; şu anki soru, ABD laboratuvarlarının bu liderlik pozisyonunu almak için adım atıp atmayacağı
  • Açık modelleri etkileyebilecek başkanlık kararnamelerine dair söylentiler daha fazla dolaşıyor ve bu durum ABD'nin liderliği ile küresel ekosistem arasındaki sinerjiyi daha da karmaşık hâle getirebilir

2 yorum

 
jjw9512151 2 분 전

Bazen Çin’e yönelik aşırı ve irrasyonel saplantının
İçimizdeki canavarı yaratıyor olmasından endişe ediyorum.

Tıpkı Nazilerin iktidara geliş gerekçelerinden birinin antikomünizm olması gibi.

 
kaydash 11 분 전

Tek bir Çin...!