Yapay zeka gelişimine ayak uydurmanın kendi yöntemim (ve sizin de bunu neden mutlaka yapmanız gerektiği)
(blog.nilenso.com)- Üretken yapay zeka en hızlı evrilen teknoloji ve hem küçümsemek hem de abartmak tehlikeli
- Güvenilir kaynakları ve itibarlı uzmanları sürekli takip etmek şart
- Simon Willison’s Blog, Andrej Karpathy, Every’s Chain of Thought gibi dengeli bir bilgi akışı öneriliyor
- Resmî yapay zeka laboratuvarı duyuruları, mühendislik blogları ve makaleler, teknolojinin gerçek ilerlemesini ve sınırlarını anlamak için vazgeçilmez
- Twitter/X, haber kürasyonu ve uzman listeleri gibi farklı kanallar sayesinde hem son gelişmelere hem de derinlemesine analizlere ulaşmak mümkün
Giriş: Yapay zeka yanlış anlamaları ve bilgi kirliliği
- Üretken yapay zeka, yazarın hayatı boyunca gördüğü en hızlı gelişen teknoloji
- Ancak yapay zekaya dair yanlış anlamalar da çok yaygın ve bilgi ortamının kendisi son derece karmaşık
- İlgili teknolojiyi yeterince anlamayan şirketlerin, devletlerin veya kişilerin bunu yanlış kullanması ya da ciddi zararlara yol açması gibi örnekler gerçekten yaşanıyor
- Yapay zekayı küçümseyen (“yakında kaybolacak bir moda”) ya da abartan (“artık programcılara gerek yok”) iki uç yanlış anlayış mevcut
- Teknolojinin doğru anlaşılmaması, bu yanlış anlamaların temel nedeni
Yapay zeka bilgisi edinme yaklaşımı
- Yapay zeka ile ilgili bilgileri doğru biçimde anlamak sanıldığından daha zor
- Çarpıtılmış bilgiler, abartılar veya bastırılmış söylemlerle günlük olarak karşılaşılan bir ortam var
- Bilgiyi bilinçli ve sistematik biçimde ayıklamazsanız hatalara, abartılara ve çarpıtmalara kolayca maruz kalma riski bulunuyor
- Yazar, dengeli bir bilgi akışı kurarak bundan fayda gördüğünü ve bunu yeni başlayanlar için iyi bir başlangıç noktası olarak önerdiğini söylüyor
Bilgi edinmenin genel ilkeleri
- Birincil kaynaklara yakın bilgilere başvurmak önemli
- Yapay zeka laboratuvarlarının resmî duyuruları veya öne çıkan isimlerin görüşleri birincil kaynak olarak doğrulanmalı
- İkincil ve üçüncül haberlere temkinli yaklaşmak gerekiyor
- Güvenilir uzmanların yorumlarını aktif olarak arayıp başvurmak gerekiyor
Önerilen bilgi başlangıç noktaları
-
Simon Willison’s Blog
- Simon Willison’s Blog (AI etiketi)
- Teknik kişiler için en çok önerilen başlangıç noktası; yapay zeka cephesi, uygulamalar, güvenlik ve etik sorunlarını geniş kapsamda ele alıyor
- Django ve Datasette’in kurucusu olarak da tanınıyor
- Örnekler: The Lethal Trifecta, LLMs in 2024
-
Andrej Karpathy
- Twitter/X | YouTube
- OpenAI kurucu üyelerinden biri ve Tesla AI eski direktörü
- Yapay zeka modellerinin iç yapısını ve çalışma prensiplerini en kolay öğrenebileceğiniz kanallardan biri; buna kültürel etkiler ve yapay zekanın toplumsal değişime etkisini gözlemleme de dahil
- Örnekler: Deep Dive into LLMs like ChatGPT, How I Use LLMs
Every’s Chain of Thought
- Every’s Chain of Thought
- Dan Shipper (Every ortak kurucusu) tarafından yazılıyor ve pratik yapay zeka kullanım deneyimleri ile benchmark’ların ötesinde gerçek model deneyimi sunuyor
- Örnekler: Vibe Check: Codex, Vibe Check: o3
Resmî yapay zeka laboratuvarı kaynakları nasıl takip edilir
- OpenAI(News), Google DeepMind(DeepMind), Anthropic(News), Meta AI(Blog), xAI(News), Qwen(Activity) gibi kaynakların resmî bloglarını, haberlerini, model kartlarını, mühendislik kılavuzlarını ve makalelerini düzenli olarak kontrol edin
- Örnekler: OpenAI o3 resmî duyurusu, Claude 4 System Card
- Mühendislik blogları: Anthropic Engineering, OpenAI Voice Agent Guide, Gemini Cookbook
- Makale örnekleri: DeepSeek R1 makalesi, Anthropic Biology makalesi
- Küçük ölçekli araştırma laboratuvarları: Nous Research, Allen AI, Prime Intellect, Pleias, Cohere, Goodfire gibi kaynaklara da bakmaya değer
Dikkat edilmesi gereken yapay zeka uzmanları ve uygulamalı mühendisler
- Açık kaynak araçlar üreten, yapay zeka mühendisliğinde pratik deneyime sahip uzmanların paylaşımları çoğu zaman resmî kılavuzlardan daha faydalı olabiliyor
Öne çıkan isimler ve bloglar
- Hamel Husain
- Shreya Shankar
- Jason Liu
- Eugene Yan
- What We’ve Learned From A Year of Building with LLMs
- LLM’lerle pratik geliştirme deneyimi olan kişilerin yazdığı uygulama örnekleri arşivi
- Chip Huyen
- Omar Khattab (Twitter)
- Kwindla Hultman Kramer (Twitter)
- Han Chung Lee
- Jo Kristian Bergum
- David Crawshaw
- Alexander Doria / Pierre Carl-Langlais
- Nathan Lambert’s “Interconnects”
- Ethan Mollick
- AI Snake Oil – Arvind Narayanan & Sayash Kapoor
Yapay zeka haberleri/medyası ve topluluklardan yararlanma
-
Twitter/X
- Twitter/X listesi
- Gerçek zamanlı yapay zeka tartışmalarının ve bilgi edinmenin merkezi; çeşitli gelişmeleri ve tartışmaları yakalamak için uygun
- Twitter akışını gazete okur gibi 15–20 dakika gözden geçirin, gerekirse yeni kişiler ve kaynaklar ekleyerek takip listenizi genişletin
-
Shawn Wang(swyx) / smol.ai
- swyx Twitter | AI News by smol.ai
- Latent Space bülteni
- Twitter’a alternatif bir kaynak olarak her gün yapay zeka gündeminin özetini sunuyor
-
Dwarkesh Patel
Derinlemesine yapay zeka tartışma/kaynak toplulukları
- LessWrong (AI Alignment), AI Alignment Forum: yapay zeka güvenliği, yönetişim, teknik analiz vb.
- Twitter gibi ana akım mecralarda pek ele alınmayan çok sayıda ileri seviye tartışma burada yer alıyor
- Örnekler: Claude plays Pokémon breakdown, The Waluigi Effect
- Gwern: yapay zeka, LLM, transformer’lar vb. üzerine ansiklopedi düzeyinde derin yazılar
- Büyük miktarda yapay zeka içeriği ve LLM ölçeklenmesi gibi öngörüsel içgörüler sunan yazılar içeriyor
- Örnekler: The Scaling Hypothesis, You could have invented transformers tutorial
- Prompt Whisperers/Latent space explorers
Bilgi edinmenin pratik yöntemi
- Tüm kaynakları eksiksiz takip etmek yerine Twitter akışına gazete okur gibi yaklaşmak daha uygulanabilir bir yöntem
- İlginç bir yazı bulduğunuzda o yazarı takip etmek ve diğer işlerine de bakmak şeklinde genişleyen bir okuma biçimi öneriliyor
- Bu, geçmişte müzik keşfetme biçimine benzer bir bilgi keşfi yöntemi
- Buna entelektüel keşfin keyfiyle yaklaşırsanız, zorunluluk değil keyif haline gelebilir
Sonuç ve öneri listesi
- Yukarıdaki uzman ve uygulayıcıların tamamını verilen Twitter/X listesi üzerinden tek seferde takip etmek mümkün
- Yakında RSS formatında bir liste de eklenecek
5 yorum
Hacker News görüşü
LLM'lerin nasıl çalıştığını temel düzeyde anlıyorsan, PR sorumlularının, blog yazarlarının, sektör liderlerinin ve internet düşünürlerinin durmaksızın ürettiği içeriğin tamamını takip etmene gerek olmadığını düşünüyorum
Hatta böyle röportajları ve yazıları takip ettikçe, gerçekte pek faydası olmayan tuhaf akımların peşine takılma riski doğuyor
Aslında modeller arasındaki farklar yalnızca birkaç yıllık bir fark düzeyindeydi; özsel farklar çok büyük değildi, bugün değişimlerin çoğu araçlar ya da entegrasyon çalışmalarında yaşanıyor
Sonuçta LLM bir "metin modeli" ve temel bilgi olmadan üretim yaptığını hep akılda tutmak gerekiyor; böylece nerede faydalı, nerede uygun değil daha iyi ayırt edilebilir
"Hayatım boyunca AI en hızlı gelişen teknoloji oldu" iddiasına da kişisel olarak pek katılmıyorum
Ben SVM'in yükseldiği dönemi, "sinir ağları şakadır" diye bakılan ortamı, ardından deep learning'i ve çeşitli DL framework'lerinin patlayarak çoğaldığı yaklaşık 10 yıllık dönemi yaşadım
O zaman da 10 yıl içinde gerçekten çok hızlı gelişmeler olmuştu
Web tarafında da JS sadece UX'i destekleyen bir şeyken, single-page app'lerin standart hale gelmesine kadar benzer bir dönüşüm yaşandı
Asıl mesele, o "çekirdek influencer listesi"ne girmiyorsan, senin için önemli hale geleceği ana kadar sessizce beklemenin çok daha iyi bir strateji olması
Ben de backbone.js döneminden sonra 10 yıl boyunca web geliştirme trendlerinin hepsini görmezden geldim, sonra React gerekli hale gelince birkaç gün çalışıp hemen kullanabildim
LSTM de 5 yıl önce herkesin nasıl implement edileceğini öğrenmeye çalıştığı bir şeydi, bugün ise transformer yüzünden eski kaldı
Kariyerim boyunca hissettiğim şey şu: "hızlı hareket ediyor" demek, "olgunlaşmamış" demektir
Hatta eski istatistiksel modelleri (GLM vb.) ve onların hâlâ pratikte nasıl işe yaradığını öğrenmek, o anın moda "prompt hack"lerini kovalamaktan çok daha üretken çözümler sağlıyor
Birincisi, mevcut araçlardan biraz farklı ya da biraz daha iyi performans veren yeni bir araç oluyor (daha önce olmayan bir işlev sunuyorsa işe yarayabilir ama çoğu kısa sürede eskiyor)
Kimi-K2, GPT 4.1 gibi isimlerden birkaç ay sonra kimse söz etmiyor olabilir
İkincisi ise modele gerçekten yeni bir yetenek eklenmesi durumu
Örneğin RL(reinforcement learning), chain of thought, gerçekten çalışan coding agent'lar, zirve seviye multimodal modeller, akıllı araç entegrasyonları gibi
Yalnızca böyle büyük sıçramalar olduğunda dikkat kesilmek yeterli
Nitekim 500 puanın üstündeki HN gönderilerine göz gezdirsen bile güncel akımı doğal olarak kavrarsın
LLM'lerin gerçek yeteneklerini öğrenmenin en iyi yolu bloglar ya da videolar değil, bizzat bir şeyler yapıp duvara toslayarak deneyim kazanmak diye düşünüyorum
Araştırmanın %99'u zaten kademeli ilerlemedir (ve bu başlı başına gayet normaldir, buna üzülmeyin)
Makalelerin çoğu gerekenden uzundur ve düzgün okuduğunuzda, matematiksel sezginiz varsa bir noktaya kadar ne çıkacağını tahmin edebilirsiniz (fikri anladıysanız sonucu da kabaca görürsünüz)
Alanın çok hızlı değiştiğini hissetmek kolay ama gerçekte hız o kadar da yüksek değil
Ben de kişisel nedenlerle 1 yıl ara verip geri döndüğümde çok büyük bir şeyin değişmediğini fark ettim
Bu bakış açısı, "güncel kalma" baskısından kurtulmayı sağlıyor
Şu anda zorlanıyorsanız, bu geride kaldığınız anlamına değil, henüz uzmanlığınızın biraz eksik olduğuna işaret eder
Nasıl ki koşmayı bilen biri bir adım geriden de yetişebilir, buradaki telaş da aslında kafamın içindeki bir kaygıdan ibaret
Asıl çekirdek algoritma (bir sonraki token'ı tahmin etme yöntemi) uzman olmayan çoğu kişiye pek bir şey ifade etmiyor
dot product, embedding gibi ayrıntılarla da kimse ilgilenmiyor. Anlatsan bile akılda kalmıyor ve çok faydası olmuyor
Mutlaka "en son trendleri" takip etmek gerekmiyor; bence yalnızca gevşek bir ilgi sürdürüp verimliliğimi gerçekten artıracak özellikleri ve yöntemleri seçerek denemek, işe yarayanları biriktirmek daha iyi (X'te birinin ne önerdiğine pek güvenmiyorum). Hatta AI konusundaki aşırı coşkuya eleştirel yaklaşan araştırmacılardan çok şey öğrenebildim[https://x.com/burkov]. Şu an ortamda aşırı abartı, değişim ve belirsizlik var. Gerçek bir yenilik çıkarsa HN'de (veya ana akım topluluklarda) mutlaka duyulur
Yazı "neden" kısmını iyi açıklamadığı için listedeki "nasıl" kısmı bana pek ikna edici gelmiyor. Değerli zamanımı başka yere ayırmam gayet yeterli
Gergeley Orosz'un "Pragmatic Engineer" bültenine aboneyim (bu aralar çok AI konusu var), Gary Marcus'un Substack'ine de bakıyorum (LLM'lere biraz daha şüpheci yaklaşıyor)
https://newsletter.pragmaticengineer.com/
https://substack.com/@garymarcus
Ayrıca Langchain, PydanticAI gibi Python paketleriyle ilgili haberleri de otomatik takip ediyorum (bu tür projeler sektörün pratik eğilimlerini belli ölçüde yansıtıyor). X(Twitter) artık kullanmıyorum ama Simon Willison gibi kişiler bazen BlueSky ve Mastodon'da da yazıyor. Sebastian Raschka, Chip Huyen gibi isimler LinkedIn'de de paylaşıyor. Her yere dağılmış olsa da sonuçta önemli haberlerin çoğuna denk geliyorsunuz
Belki ben önemli şeyleri kaçırmış olabilirim ama kritik ve anlamlı güncellemeler nasıl olsa doğal biçimde HN ana sayfasında ya da yorumlarda dile getiriliyor
Esas olarak LLM'leri ve frontier AI model haberlerini takip etmek istiyorsan, öneri listesi çok iyi; yarıdan fazlasını ben de bağımsız olarak keşfetmiştim
X(Twitter)'da AI hesaplarından oluşan bir liste yapıp takip ediyorum ve genel olarak en sağlam bilgi kaynağı bu
Bazılarının blogları ve podcast RSS'leri de işe yarıyor (araştırmacıysan makale RSS'leri zaten vazgeçilmez)
Ben ek olarak https://epoch.ai, podcast tarafında Dwarkesh Patel, blog olarak Peter Wildeford, @omarsar0(DAIR elvis) ve doğrudan çeşitli araştırmacıları takip etmeyi öneririm (bunların bir kısmı bilgi vermekten çok eğlence amaçlı da olabiliyor)
Bu alandaki bilgi ortamı ciddi biçimde kirlenmiş durumda. Özellikle NYT gibi meseleyi daha çok siyaset tarafından ele alan medyayı takip ederseniz, daha da çarpık ve hatalı bir resim elde edersiniz
Bu arada generative AI ile doğrudan ilgili olmayan ML alanlarında (ör. protein, genomik, hava durumu modelleri, diffusion ve görsel üretim araştırmaları gibi) bilgi kaynakları tamamen farklı
AI/ML kategorisi o kadar geniş ki hepsini birden takip etmek imkânsız
Takip etmek şart mı derseniz, hayır değil
Çoğu insan bunu sadece yeni teknolojiye ve son trendlere duyduğu meraktan yapıyor
Ama yazılım geliştirme gibi alanlarda AI'yi tamamen görmezden gelmek, orta ve uzun vadede kariyer açısından ciddi zarar verebilir (yalnızca araçları öğrenerek yaklaşmak da yeterli olabilir)
Ben işimin doğası gereği genel gidişatı anlamam gerektiği için düzenli biçimde takip ediyorum
Simon Willison'ın blogu bile tek başına güncel ve yüksek kaliteli bilgi öğrenmek için yeterli (neredeyse hiç gürültü yok, S/N oranı çok yüksek)
Zorunlu olarak "trend" takip etmeye gerek yok
Teknoloji işleri giderek azalıyor ve bir noktada sert biçimde düşecek (AI bir kişinin 10 kişinin işini yapmasını sağlayacak, sonra beyaz yaka, mavi yaka — Amazon depo robot işleri gibi — tarafında da benzeri olacak)
Ben şahsen bu hafta GPT Plus aboneliğimi iptal ettim, artık "o canavarı" daha fazla beslemek istemiyorum
Harita desteği (ör. gezi rotası, arkadaşlarla halka sürüş rotası vb.) gibi işlerde Gemini'nin ücretsiz sürümü hatta daha iyi
Sadece ilk öneriyi izlemek bile (simow'un blogunu okumak) çoğu zaman yeterli olur
Andrej Karpathy'nin dersleri bana inanılmaz yardımcı oldu
YouTube'da da var(https://www.youtube.com/@AndrejKarpathy)
Makine öğrenimi araştırmacılarına mentorluk yapan ve yardım eden bir konumda olsam da Andrej'i dinleyince kendimi hiçbir şey bilmeyen bir öğrenci gibi hissediyorum
Başta tuhaf gelmişti ama şimdi o alçakgönüllülüğün kendisi benim için çok değerli bir kazanım
Gerçekten de "hiçbir şey bilmiyorum" duygusu önemli
üzgünüm, okunabilirliği hiç yok
Bunu bu kadar okunaksız buluyorsanız, sanırım sorun ana metinde değildir.
Katılıyorum.
Şu anda kesinlikle gerekli olan bir yazı türü.