Yapay zeka girişimcisinin acı dersi (Bitter Lesson)

xguru · 2025-02-10T11:06:01+09:00

AI Safety girişimi Andon Labs'ın (YC w24) kurucusu Lukas Petersson'un dört bölümlük yazısının tek bir derlemesi Tarihsel olarak yapay zeka alanında genel amaçlı yaklaşımlar her zaman kazandı Bugünün AI uygulama alanındaki kurucuları, geçmişte AI araştırmacılarının yaptığı hataları tekrarlıyor Daha iyi AI modelleri genel amaçlı AI uygulamalarını mümkün kılacak; aynı zamanda AI modelleriyle ilişkili yazılımların katma değeri de azalacak Bölüm 1: Tarih tekerrür eder Bölüm 2: Rekabet avantajı yok Bölüm 3: Tarihin ayak izleri Bölüm 4: Siz bir büyücüsünüz Bölüm 1: Tarih tekerrür eder (History Repeats Itself) Kısaca: Son dönemdeki AI ilerlemeleri, çeşitli sorunları çözen yeni ürünleri mümkün kıldı Ancak ürünlerin çoğu mevcut modellerin sınırlı yetenekleri içinde çalışıyor; AI'nin asıl gücü olan esnekliği kullanamıyor AI tarihi, genel amaçlı yaklaşımların her zaman kazandığını tekrar tekrar gösteriyor. Richard Sutton bunu "The Bitter Lesson"da vurguluyor Bugünün AI kurucuları, geçmişte AI araştırmacılarının düştüğü hataları tekrarlama eğiliminde Richard Sutton'ın şu denemesinin özeti: The Bitter Lesson. (Korece çeviri) Şu dersleri ortaya koyuyor: AI araştırmacıları bilgiyi ajana entegre etmeye çalışır Bu kısa vadede işe yarar ve tatmin edicidir Uzun vadede ise ilerleme durur, hatta daha ileri gitmeyi engeller Sonunda, bunun tam tersi yaklaşıma dayanan hesaplama ölçeğinin büyümesiyle atılım gelir Bu örüntünün AI araştırmalarında tekrar tekrar görüldüğünü ve bugün de sona ermediğini söylüyor AI ürünleri ve The Bitter Lesson AI ürünleri genel olarak bir AI modeli ve onu çevreleyen yazılımdan oluşur Performansı artırmanın iki yolu vardır: Hataları azaltmak için yazılımı kısıtlayan mühendislik çalışmaları Daha iyi modellerin çıkmasını beklemek Modeller geliştikçe mühendislik çalışmalarının değeri azalır OpenAI'nin yeni model yayınlarıyla prompt engineering'in değerinin düşmesi buna örnek gösterilebilir Kısıt türleri ve AI ürünleri AI ürünlerindeki kısıtlar iki gruba ayrılabilir: Özgüllük: Belirli bir soruna odaklanan yazılım (dikey çözüm) Otonomi: AI'nin işleri kendi başına yapabilme yeteneği Buna göre AI ürünleri sınıflandırılabilir: özgüllük (Vertical vs. Horizontal) ve otonomi (Workflow vs. Agent) Vertical Workflow Belirli bir sorunu çözmek için sabit bir sırayla çalışan sistem Harvey bunun tipik bir örneği; belirli hukuki görevler gibi dar bir alandaki sorunları işlemek üzere tasarlanmış bir workflow sistemi Vertical Agent Belirli bir görev alanında otonom çalışan ve çalışma sırasında kendi kararlarını veren sistem Devin bunun tipik bir örneği; sınırlı araç ve verilerle tekrarlayan görevleri yerine getirir ve gerektiğinde görev adımlarını ayarlar Horizontal Workflow Çeşitli sorunları çözebilen genel amaçlı workflow sistemi ChatGPT bunun tipik bir örneği; farklı türde girdilere önceden tanımlı prosedürlere göre yanıt verir ama tam otonomiye sahip değildir Horizontal Agent Çeşitli sorunları ele alabilen tamamen otonom sistem Claude computer-use bunun tipik bir örneği; şirketin standart yazılımlarını kullanarak kullanıcının talimatlarına göre çalışır ve sorunları insana benzer şekilde çözer Vertical Workflow ile The Bitter Lesson arasındaki bağ Demo Day'de tanıtılan ürünlerin çoğu Vertical Workflow kategorisine giriyor Mevcut modellerin güvenilirliği henüz yeterli olmadığından başka yaklaşımlar zor Karmaşık sorunları bile kabul edilebilir performans elde etmek için Vertical Workflow'a indirgeme eğilimi var Mühendislik çalışmalarıyla bu çözümler geliştirilebilir, ancak bunun da sınırları vardır Mevcut modellerle çözülemeyen sorunlarda daha gelişmiş modelleri beklemek daha iyi bir strateji olabilir Leopold Aschenbrenner'in gözlemi: daha iyi modelleri beklemek için gereken süre, mühendislik çalışmasından daha kısa olabilir The Bitter Lesson ile bugünkü AI ürünleri arasındaki ilişki AI araştırmacıları, “kabul edilebilir performans” için bilgi tabanlı çözümler tasarladı; ancak sonunda daha fazla hesaplama kaynağı kullanan genel çözümler bunları geçti Bugünkü AI ürün geliştirme yaklaşımı da bu örüntüye benziyor Bitter Lesson'daki dört gözlem ve bunların kısıt türlerine uygulanması Bitter Lesson'da sözü edilen dört temel gözlem, AI ürünlerindeki otonomi ve özgüllük kısıtlarında da açıkça görülür. Bunları her bir kısıt açısından açıklarsak şöyledir: Birinci gözlem: AI araştırmacıları bilgiyi ajana entegre etmeye çalışır Otonomi kısıtı: Geliştiriciler otonom ajanlar dener, ancak güvenilirlik düşüktür Bunun yerine görev adımlarını workflow biçiminde hard-code eder ve sistemin, kendi sorun çözme yöntemleriyle aynı prosedürü izlemesini sağlar Özgüllük kısıtı: Geliştiriciler genel amaçlı bir belge analiz sistemi kurmak ister, ancak güvenilirlik sorunları yaşar Bunun yerine finansal tablolar gibi belirli belge türlerine odaklanır, somut metrikleri ve doğrulama kurallarını hard-code eder İkinci gözlem: Kısa vadede etkilidir ve araştırmacıya tatmin sağlar Otonomi kısıtı: Workflow'u hard-code etmek istikrarı artırır Özgüllük kısıtı: Yalnızca dar kapsamlı belge ve metrikleri işleyecek şekilde uzmanlaşmak doğruluğu artırır Üçüncü gözlem: Uzun vadede ilerleme durur, hatta engellenir Otonomi kısıtı: Hard-code edilmiş workflow'lar yeni durumlarla başa çıkamaz ve bu da hatalı sonuçlara yol açar Özgüllük kısıtı: Yalnızca belirli sorunları ele alan sistemler, birleştirilmiş belgeler ya da kazanç açıklaması analizi gibi ilişkili görevleri işleyemez Her görev için ayrı bir özelleşmiş sistem gerekir Dördüncü gözlem: Atılım, hesaplama kaynaklarının ölçeklenmesiyle gelir Otonomi kısıtı: Yeni modeller dinamik olarak uygun yaklaşımı bulur, gerektiğinde hataları düzeltir ve güvenilir otonom ajanları mümkün kılar Özgüllük kısıtı: Yeni modeller tüm iş belgelerini kapsamlı biçimde anlayıp ilgili bilgileri çıkarabilir; böylece özelleşmiş sistemlere gerek kalmaz Otonomi gerektiren sorunlarda daha otonom ürünler daha iyi performans gösterir Karmaşık ve geniş bir girdi alanı söz konusu olduğunda daha az özelleşmiş ürünler daha iyi sonuç verir Sonuç: AI girişimleri ve The Bitter Lesson Bu yazı, girişimlerin AI'deki rolünü inceleyen dört bölümlük serinin ilki; alan bilgisini kullanan AI modellerinin zamanla hesaplama kaynaklarından yararlanan modeller tarafından yerinden edildiği tarihsel örüntüyü vurguluyor Bugünün AI ürünleri bu örüntüye şaşırtıcı derecede benziyor Mevcut modellerin sınırlamalarını telafi etmek için yazılım geliştirmek, özellikle modellerin hızla ilerlediği bir ortamda, başarı şansı düşük bir strateji YC partneri Jarred'in işaret ettiği gibi: ilk nesil dikey workflow LLM uygulamaları, yeni nesil GPT modelleri tarafından yerinden ediliyor Sam Altman'ın tavsiyesi: daha iyi modellerin çıkışından korkmayan, hatta bunu bekleyebilen girişimler kurmak önemli AI uygulama katmanındaki birçok kurucu yeni model çıkışlarını heyecanla bekliyor, ancak bu tehlikeli bir sinyal olabilir Daha iyi modeller çıkarsa mevcut rekabet avantajı azalabilir Özellikle daha zor sorunları daha etkili çözebilen ürün performansı açısından bu risk daha da belirginleşir Bir sonraki yazı, pazar benimsenmesi denen başka bir boyutu inceleyecek ve daha iyi performansın pazarda başarıyı mutlaka garanti etmediğini tartışacak Bölüm 2: Rekabet avantajı yok (No Powers) tl;dr: Yapay zeka tarihinde, model sınırlarını alan bilgisiyle telafi etmeye çalışan yaklaşımlar çoğu zaman sonunda hesaplama gücünden yararlanan daha genelleştirilmiş yaklaşımlara yenildi Dikey AI (vertical AI), mevcut modellerin sınırlarını telafi etmek için belirli görev akışlarını (workflow) önceden tanımlayarak doğruluğu artıran bir yöntemle pazara önce giriyor Yatay AI (horizontal AI), ChatGPT gibi genel amaçlı modelleri kullanıp sürekli gelişen bir yapı olarak, model iyileştikçe birçok alanda daha üstün performans gösterme potansiyeline sahip Uzun vadede yatay AI, çok sayıda kısıt içeren dikey AI'ya kıyasla daha yüksek performans ve esneklik sunarak üstünlük kurabilir Problem zorluğu ve performans eğrisi Figure 1, dikey AI'nın pazara önce girdiği ancak modeli gelişmiş yatay AI'nın sonunda performansta onu geçtiği basit bir örneği gösteriyor Problem zorluğunun yüksek olduğu durumlarda (Figure 2), dikey AI yeterli performansa hiç ulaşamazken çözüm ancak yatay AI geliştikten sonra mümkün hale geliyor Bugün itibarıyla dikey AI'nın uygulanabildiği problemler görece “düşük zorluklu problemler” olduğundan, bu kategoride ilk giren avantajı elde edebilir; ancak uzun vadeli rekabet gücü belirsizdir Yatay AI'nın sunduğu “uzaktan işbirliği yapan çalışan” kavramı Gelecekte yatay AI, uzaktan çalışan biri gibi bilgisayar ve hesaplara erişim verilen, gerekli veriyi kendi bulup kullanabilen bir forma evrilebilir ChatGPT gibi birçok kullanıcının zaten alışık olduğu arayüzler kademeli olarak güçlenerek şirketlerde hızlı benimsemenin önünü açabilir Yatay AI, model her iyileştiğinde çeşitli yetenekleri anında bünyesine kattığı için, dikey AI'ya göre rekabet avantajını koruması daha kolaydır Önceki örnek: AcademicGPT deneyimi GPT-3.5 döneminde uzun girdi sınırını aşmak için AcademicGPT piyasaya sürüldü; ancak GPT-4 uzun girdiyi yerleşik olarak sununca mevcut çözüm hızla geçersiz hale geldi YC partneri Jared'in dediği gibi, “İlk nesil LLM uygulamalarının çoğu bir sonraki nesil modellere yenildi” Aynı anda birçok işlev sunan dikey AI da, model performansı geliştikçe sonunda aynı riski taşıyor Helmer'in 7 Powers analizi Bu bölüm, Hamilton Helmer'in 7 rekabet avantajı (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource) üzerinden dikey AI'nın yatay AI ile rekabet edip edemeyeceğini inceliyor Switching Cost (geçiş maliyeti) Kullanıcılar belirli bir dikey AI çözümünün arayüzüne veya iş akışına alışmış olsa bile, yatay AI “yeni bir çalışan işe alır gibi” basitçe onboard edilerek uygulanabilir ChatGPT gibi yatay AI çözümlerini halihazırda kullanan şirketlerin sayısı arttığı için, geçiş süreci zor olmayabilir Fiyat açısından da yatay AI, birden çok dikey çözümü birleştirebildiğinden maliyet tasarrufu sağlayabilir Counter Positioning (ters konumlanma) Dikey AI, belirli bir pazara özelleşmiş çözüm olarak kişiselleştirilmiş değer sunabilir; ancak modeller geliştikçe yatay AI'nın genel olarak daha iyi performans gösterme ihtimali vardır Dikey AI, her yeni modeli devreye alırken mevcut “kısıtlar” nedeniyle farklılaşmasını yitirme ya da kısıtları kaldırdığında sonunda yatay modele benzemeye başlama ikilemiyle karşı karşıya kalır Scale Economy (ölçek ekonomisi) Dikey AI da SaaS gibi ölçekle maliyet düşürebilir; ancak yatay AI'nın da çok sayıda alanı birleştirerek maliyetleri yayabilme avantajı vardır Büyük ölçekli Ar-Ge yatırımlarıyla geliştirilen yatay modellerin farklı kullanım alanlarına uygulanması, maliyet düşüşünü hızlandırabilir Network Economy (ağ etkisi) Hem dikey AI hem yatay AI kullanıcı verileriyle gelişebilir; ancak yatay AI, daha geniş bir kullanıcı kitlesinden geri bildirim alarak modelin genel performansını artırma konusunda çok daha avantajlıdır Farklı alanlarda biriken verilerle modelin geneli iyileştiği için, dikey AI'nın yetişemeyeceği bir hızda ilerleyebilir Brand Power (marka gücü) Marka gücü, küçük startup aşamasında elde edilmesi zor bir avantajdır OpenAI ya da Google gibi marka etkisi zaten güçlü şirketler istisna olsa da, çoğu dikey AI startup'ı marka gücünü silah olarak kullanamaz Process Power (süreç gücü) Süreç gücü de büyük şirketlerin uzun zaman içinde rafine ettiği operasyonel sistemler sayesinde elde edilen bir avantajdır Erken aşama startup'lar için bu neredeyse geçerli bir kategori değildir Cornered Resource (tekel niteliğinde kaynak) Tekel niteliğindeki kaynak, belirli veri ya da kaynağın yalnızca tek bir şirketin elinde olduğu ve bu kaynağın ilgili alanda mutlaka gerekli olduğu durumlarda büyük bir rekabet avantajı haline gelir Birçok AI startup'ı “özel/veriye erişim avantajı” olduğunu iddia etse de, pratikte bu veri ya gerçekten tekel niteliğinde değildir ya da o veri olmadan da model yeterince eğitilebilir İstisna olarak gerçekten tekel niteliğinde kaynağa sahip şirketler, yatay AI'nın gelişimine rağmen rekabet güçlerini koruyabilir Sonuç Sonuç olarak, dikey AI ilk giren avantajını yakalasa bile yatay AI daha yüksek performansa ulaştığında dikey AI'nın büyük kısmını ayakta tutmak zorlaşır Helmer'in 7 Powers çerçevesinde yalnızca gerçek bir “Cornered Resource” elde eden durumlarda dikey AI'nın uzun vadeli ivme yakalaması mümkündür AcademicGPT'nin GPT-4 çıktıktan sonra hızla çökmesi örneğinde olduğu gibi, birçok işlevle güçlendirilmiş dikey AI da model geliştikçe sonunda benzer bir kaderle karşılaşabilir Bir sonraki bölümde (Bölüm 3), “uzaktan işbirliği yapan çalışan” biçimindeki yatay AI'nın ne zaman ve nasıl gerçeğe dönüşebileceği; bunu engelleyen teknik, düzenleyici, güven ve ekonomik bariyerler ayrıntılı biçimde ele alınacak Bölüm 3: Tarihte Bir Dipnot (A Footnote in History) Anthropic CEO'sunun “virtual collaborator” kavramını açıkladığı bir röportaj yayımlandı Bu, yazarın bu seride “horizontal AI product” dediği kavrama benziyor OpenAI'nin yakında “Operator”ı duyurması bekleniyor ve sızan benchmark'lara göre performansı Claude'un belirgin biçimde önünde (OSWorld benchmark'ında Claude %22, Operator %38) Bu performans artışı beklenen aralıkta ve yazar 3 ay önceki öngörüsünü aynen koruyor Önceki bölümde, dikey AI uygulamalarının neden rekabet gücünü korumakta zorlandığı açıklandı Genel AI çözümleriyle arasındaki performans farkı azalıyor Yatay AI ürünleri rekabetçi hale geldiğinde, dikey AI ürünlerinin kendini savunmasının neredeyse yolu kalmıyor Temel soru: “Dikey AI'dan yatay AI'ya geçiş ne zaman olacak?” Eğer bu 10 yıl sonra olacaksa, bugün dikey AI geliştirmek anlamlı olabilir Ama değişim 1-2 yıl içinde gelecekse, tamamen farklı bir strateji gerekir Dikey AI'dan yatay AI'ya geçiş tüm sektörlerde aynı anda yaşanmayacak Ancak bugün çoğu AI startup'ının odaklandığı pazarlar görece basit alanlar olduğundan, ana sektörlerde değişimin benzer zamanlarda gerçekleşmesi bekleniyor 2027'ye kadar çoğu sektörde dikey AI ürünlerinin hayatta kalmasının zor olacağı öngörülüyor “Adoption”, kullanıcıların yeni bir problemi çözerken ya da mevcut bir problemin çözüm yöntemini değiştirirken hangi ürünü seçtiği anlamına geliyor Aşağıdaki unsurlar hesaba katılmıyor Pazar payı: Mevcut sözleşmeler gibi etkenler rol oynayabilir Mutlak büyüklük: AI yeni kullanım alanları açtıkça pazar büyüyecek olsa da, bu analiz yalnızca göreli değişimi ele alıyor Potansiyel değer: İnsanların bugün hangi çözümü seçtiği değerlendiriliyor; gelecekteki iyileşme olasılığı dahil edilmiyor Örneğin akış A'dan B'ye kayıyorsa, geçmişte A tercih ediliyordu ama artık B daha iyi seçenek olarak görülüyor Dikey/yatay AI ve iş akışı/ajan kavramı "Dikey (vertical) AI" ve "yatay (horizontal) AI", farklı AI ürün türlerini ifade eder. "Workflow" ve "agent" da AI ürünlerini sınıflandırmak için kullanılan kavramlardır. Bu belgede, yatay AI ürünleri içindeki workflow ve agent kavramları birlikte ele alınıyor. Aynı şirketin her iki işlevi de içeren bir ürün geliştirmesi büyük olasılıktır. Örneğin ChatGPT, agent özellikleri eklerken mevcut workflow tabanını da koruyabilir. Geçmiş (1) Pre-ChatGPT dönemi, geleneksel yazılımların pazara hakim olduğu bir dönemdi. (2) ChatGPT'nin çıkışıyla birlikte ilk anlamlı yatay AI ürünü ortaya çıktı. (3) GPT-3.5 API'nin ortaya çıkmasının ardından ilk kez AI'ya özel çeşitli dikey ürünler piyasaya sürülmeye başlandı. Bu yıl (4) 2025'te model performansının pratik agent'lar olarak kullanılabilecek kadar istikrarlı hale geleceği öngörülüyor. Şimdiye kadar yalnızca araştırma projelerinde veya sınırlı denemelerde kullanılan agent'ların artık ciddi biçimde devreye alınması bekleniyor. Mevcut dikey workflow ürünlerinin de AI agent formatına dönüşme ihtimali var. (5) Agent'lar ortaya çıksa bile 2025'e kadar dikey workflow'ların baskın konumunu koruması bekleniyor. Kullanıcıların halihazırda kullandıkları araçları değiştirmek istememesi ve geliştiricilerin şimdiye kadar oluşturdukları mühendislik varlıklarını kullanmayı sürdürme eğilimi bunda etkili oluyor. (6) ChatGPT, Claude ve Gemini gibi başlıca yatay AI ürünlerinin yeteneklerini genişleterek daha fazla dikey alanı kapsaması bekleniyor. Dikey AI ürünlerinin mevcut uzmanlaşmış özellikleri, yatay AI ürünlerine hızla dahil olabilir. ChatGPT'nin masaüstü uygulamalarıyla entegrasyona şimdiden başlamış olması buna örnek. Yakın gelecek (7) Yatay AI agent'ları ile insan çalışanlar arasındaki yetenek farkının giderek daralacağı öngörülüyor. Uzman seviyesine ulaşmasa bile, genel ofis işlerinin önemli bir kısmını otomatikleştirebilecek performansa erişmesi bekleniyor. Bu da dikey AI çözümlerinin varlık nedenini zayıflatabilir. Somut örnekler: Bireysel kullanıcılar vergi beyanı veya iş başvurusu hazırlığı gibi karmaşık işleri yatay agent'lara bırakabilir. Şirketler junior seviyedeki çalışanların önemli bir bölümünü ikame edebilir veya azaltabilir. Tek bir kişinin unicorn değer yaratabildiği örnekler ortaya çıkabilir. (8) Geleneksel yazılımların, agent'ların kullanabileceği bir arayüz olarak değerini korumaya devam edeceği düşünülüyor. Agent'ların tüm yazılımları sıfırdan yeniden üretmesindense mevcut yazılımları kullanması daha maliyet etkin olabilir. Özellikle genel amaçlı ve yatay yazılımların hayatta kalma olasılığının daha yüksek olduğu değerlendiriliyor. (9) Hayatta kalacak dikey AI ürünlerinin, 2. bölümde anılan savunmacı kaynaklara (özel/veri tekeli, patent vb.) sahip az sayıdaki örnek olması bekleniyor. Bu şirketler, söz konusu kaynakları yüksek değerlerle satma imkanına da sahip olabilir. 2024 - İlerleme durdu mu? 2024'te AI modellerinde bir duraklama yaşandığı iddiası ikna edici bulunmuyor. o3'ün çıkışından önce de GPT-4, Claude ve Open Weight modelleri dahil çeşitli alanlarda model performansı istikrarlı biçimde gelişmeye devam etti. ARC-AGI, GPQA Diamond gibi ölçütlerde benchmark skorları radikal biçimde yükseldi. Anthropic'in Claude 2'den Claude 3'e ve ardından Claude 3.5 Sonnet'e hızlı bir evrim geçirdiği, ayrıca açıklanmayan yükseltmeleri şirket içinde kullandığı yönünde tahminler bulunuyor. Bu nedenle 2024'ün AI model iyileştirmelerinin durduğu yıl olduğu iddiasını destekleyen yeterli dayanak olmadığı görüşü öne çıkıyor. Olası engeller Model Stagnation: 2024'te duraklama olmasa da 2025 sonrasında model gelişiminin yavaşlayabileceği veya durabileceği endişesi var. Ilya Sutskever, NeurIPS'te geleneksel pre-training yaklaşımının sınırlarına değindi; ancak aynı zamanda test-time compute gibi başka yolların da bulunduğunu ima etti. Önde gelen AI araştırma kurumları ve şirketleri hâlâ büyük ölçekli hesaplama kaynaklarına agresif biçimde yatırım yapıyor. Regulation: Beklenmedik düzenlemeler ortaya çıkarsa AI gelişimi kısıtlanabilir. Trust Barriers: Kullanıcıların agent'ların güvenliği ve güvenilirliği konusunda çekinceleri var. Geçmişte asansör otomasyonuna dair korkuların zamanla ortadan kalkmış olması, bunun da aşılabileceğine işaret ediyor. AI Labs Hesitate: Anthropic veya OpenAI gibi kuruluşlar, gerçek teknik kapasiteye sahip olsalar bile kullanıcı etkileşimini kısmen sınırlı tutmayı tercih edebilir. Expensive Inference: o3 örneğinde olduğu gibi yüksek performanslı çıkarım çok yüksek maliyet gerektirebilir. Ancak çıkarım maliyetleri zamanla düşüyor ve agent'ların her görevde aynı düzeyde yüksek performanslı çıkarımı kullanması gerekmeyebilir. Tüm bu unsurlar birlikte değerlendirildiğinde, teknolojik ilerlemeyi öngörmek zor olsa da dikey AI startup'larının önünde fazla zaman kalmadığı düşünülüyor. AI modelleri gelişmiş hale geldikçe, mevcut mühendislik tabanlı değerin hızla yok olabileceğini gösteren U biçimli bir değer eğrisi sunuluyor. Notlar o3'te görülen test-time compute ölçeklenmesinin, mevcut araştırmalar temelinde zaten öngörülebilen bir sonuç olduğu belirtiliyor. AlphaZero örneğinde görüldüğü gibi, doğrulanabilir ortamlarda performans çok hızlı biçimde insanüstü seviyeye ulaşabiliyor. o3'ün kodlama ve matematik gibi alanlarda güçlü olmasına karşın, yaratıcı yazarlık gibi diğer alanlarda o1'e kıyasla büyük bir fark göstermediği değerlendirmesi yapılıyor. Gelecekte yeni bir dikey AI geliştirmektense, daha geniş kapsamlı veya daha özel kaynakları ele alan başka yönelimlerin girişimciler için daha avantajlı olabileceği ima ediliyor. Bölüm 4: Siz bir büyücüsünüz (You’re a wizard Harry) Kurucu, bir büyücü gibidir Yoktan var etme yeteneğine sahiptir. Yeni bir şirket başlatmak için özgün düşünce gerekir. Paul Graham'ın (PG) sözü: "Fikirler yalnızca doğru değil, aynı zamanda özgün de olmalıdır. Herkesin iyi fikir olduğunu kabul ettiği bir şeyi başlatmamalısınız." Pek çok kurucu, akranlarının etkileyici gelir artışına kapılıp bağımsız düşünme yetisini kaybediyor. Herkes aynı şeyi yapıyor ve bunun işe yaradığı görülüyorsa, bağımsız düşünmek zorlaşıyor. Yazar, bağımsız düşünmeye çalıştığını ve bu fikirlerin kulağa kötü gelmesini umduğunu söylüyor. Yatay agent'ların geleceği ve rekabet AI uygulama katmanına hakim olacak yatay agent'ların AI laboratuvarları tarafından geliştirileceği öngörülüyor. Model performansındaki farklar tek bir kazanan yaratabilir, ancak Anthropic, OpenAI, GDM ve xAI arasında sert rekabet yaşanması daha olası görülüyor. Bu durum kısa vadede son kullanıcı için faydalı bir fiyat rekabetine yol açıyor. AI laboratuvarları kısa vadede çok büyük finansal değeri yakalayamasa bile, yine de son derece güçlü bir konumda olacakları düşünülüyor. Bu nedenle kurucuların, startup'larını bu laboratuvarlarla olan ilişki bağlamında değerlendirmesi mantıklı görülüyor. Müşteri olarak yaklaşım bölümde tartışıldığı gibi, LLM API kullanan AI dikey ürünleri inşa etmek mümkündür; ancak bu yalnızca önemli kaynaklara münhasır erişim olduğunda mümkündür. AI dikey ürünü inşa etmek için, bu tür kaynakları bulmaya olağanüstü çaba harcamak gerekir. Rakip olarak yaklaşım Eğer geleceği yatay ajanlar temsil ediyorsa, neden bunu inşa etmeyelim? Üç yaklaşım inceleniyor Pazarı önce ele geçirmek Yapay zeka laboratuvarları, ancak modeller yeterince güvenilir hâle gelip minimum mühendislik çabasıyla yatay ajanlar kurulabildiğinde dikey iş akışlarıyla ciddi biçimde rekabet edecek Önceki modellere mühendislik çabası uygulanarak teorik olarak laboratuvarlardan önce pazara girilebilir, ancak bu kesin değil Leopold Aschenbrenner, bu çabanın bir sonraki modeli inşa etmekten daha uzun sürebileceğini düşünüyor: "uzaktan çalışanların birçok işi otomatikleştirebilmesi zaman alabilir ve bu sırada ara modeller hâlâ tam olarak kullanılmamış ve entegre edilmemiş olabilir" Pazara önce kim girerse girsin, bu avantajın uzun sürmemesi bekleniyor Ajan API wrapper'ı Ev arkadaşı, "dünyada UI becerisine sahip kimse yok mu?" diye sormuş Bu iki soruna işaret ediyor: 1) API maliyetleri nedeniyle marjlar sürdürülemez, 2) laboratuvarlar en iyi modellerini açmıyor (ChatGPT arama, web browsing vb. için özel modeller kullanıyor) Şu anda GPT API kullanarak ChatGPT ile doğrudan rekabet eden kimse yok ve bu kalıbın yatay ajanlarda da tekrarlanması bekleniyor Açık kaynak modeller Açık kaynak modeller başka bir yol sunabilir Perplexity, laboratuvarlarla yatay ürün alanında rekabet etmenin mümkün olduğunu gösteriyor Ancak açık kaynak modeller basit benchmark'larda iyi performans gösterse de karmaşık ajan görevlerinde zorlanıyor Llama-3.1-405b, MLE-bench'te state-of-the-art modellere kıyasla belirgin biçimde geride kalıyor Andon Labs bu tür benchmark'larda uzmanlaşıyor ve bu da bizim gördüklerimizle örtüşüyor Deepseek V3 ve R1 çok etkileyici sonuçlarla yayımlandı, ancak o3 de öyle ve Anthropic'in içeride daha iyi sürümlere sahip olduğu biliniyor Açık kaynak modellerin state-of-the-art'a yaklaşması mümkün olabilir, ancak onu aşacakları şüpheli Yine de yatay oyunda rekabet etmek için yeterli olabilir Çıkarım maliyetleri hâlâ çok yüksek olacak Tedarikçi olarak yaklaşım Eğer yapay zeka laboratuvarları gerçekten bu kadar güçlü hâle gelirse, onlara tedarikçi olmak harika bir konum olur Açıkça çok fazla hesaplama gücüne ve elektriğe ihtiyaç duyacaklar Leo'nun analizi doğruysa, beklenenden de fazlasına ihtiyaç duyabilirler Bu fırsat sektörel uzmanlık gerektiriyor ve bu, şu anda yapay zeka uygulama katmanındaki girişimciler için doğal bir alan olmayabilir Ama senin bir büyücü olduğunu unutma Laboratuvarlar ayrıca üçüncü taraflardan veri satın alıyor Scale AI, bunun harika bir iş olduğunu kanıtlıyor Ancak yapay zeka laboratuvarlarının "self-play"i çalıştırıp çalıştıramayacağı şüpheli AlphaZero dış veri olmadan eğitildi ve bu, gelecekteki yapay zeka modelleri için kutsal kâse olarak görülüyor Eğer self-play'i çalıştıramazlarsa, alternatif muhtemelen birden çok sonradan eğitim veri setini birleştirmek olacaktır Bu dünyada veri satmak muhtemelen iyi bir seçenek olur Ekosistem katkıcısı olarak yaklaşım Yapay zeka laboratuvarlarıyla ilişkide değerlendirilmeye değer son seçenek ekosistem katkıcısı olmak Bu, yatay ajanlara yardımcı olan araçlar inşa etmek anlamına geliyor, ancak kritik nokta bunun ajanın kendisinden ayrı olması gerektiği Bölüm 3'te gösterildiği gibi, ajanların verimli arayüzlere ihtiyacı olduğu için geleneksel yazılım varlığını sürdürecek Ajanlar kendi yazılımlarını yazabilir, ancak çıkarım maliyetleri bunu pratik olmaktan çıkarabilir Ancak ekosistem oyuncuları emtialaşma riski taşır ve değerin büyük kısmı başka yerde yakalanabilir Bu, yatay ajanları çalıştırmanın çıkarım maliyetinin (inference cost) ne kadar yüksek olduğuna bağlı olacak Eğer çıkarım maliyeti düşükse, ajanların ihtiyaç duydukları yazılımı kendilerinin üretmesi daha yaygın olacaktır Ya yapay zeka yatay ajanları geç gelirse? Zaman çizelgesi (timeline) çok önemli Eğer yatay ajanlar ancak 10 yıl sonra rekabetçi hâle gelecekse, bugün dikey yapay zeka iş akışları kurmak harika bir fikir olur Bu kadar süre, büyük ve sağlam bir şirket kurmak için yeterlidir Ancak yapay zeka laboratuvarlarının ilerleme hızına bakınca 10 yıl gerçekçi görünmüyor Peki 4 yıl sonra ne olur? 4 yıl büyük bir şirket kurmak için yetersiz olabilir, ama yeterli yineleme (iteration) fırsatı sunar Yapay zeka uygulama katmanında başlamak, sonrasında vendor veya ekosistem oyuncusuna dönüşmek için avantajlı olabilir Sonsöz: YC(Y Combinator)'nin hatası mı? Yüzeyden bakıldığında YC yanlış seçimler yapıyor gibi görünebilir Şu anda YC yatırımlarının çoğunu dikey yapay zeka ürünlerine yoğunlaştırıyor Ancak bu pazarın yakında ortadan kalkma ihtimali yüksek Ancak yazarın VC (girişim sermayesi) konusunda uzmanlığı yok, bu yüzden kesin bir sonuca varmıyor Sadece kafası karışık ve düşüncelerini paylaşıyor YC, nispeten tarafsız bir yatırım stratejisi izlediğini söylüyor Zeki insanlara yatırım yapıyor ve en iyi fikirleri onların bulmasını umuyor Bu harika bir strateji ve yüzlerce kurucu geleceği 14 YC partnerinden daha iyi öngörebilir Ancak yazar, YC'nin batch sisteminin kısa vadeli düşünmeyi teşvik edebileceğinden endişe ediyor YC'de haftalık hedefler koymak çok önemli ve büyük bir grup içinde ilerlemek motivasyon açısından iyi Ancak fikir çeşitliliği yeterli değilse, bu kısa vadeli düşünmeyi teşvik edebilir Dikey yapay zeka ürünleri yaparak hızla 5.000 dolar MRR seviyesine ulaşılabilir Ama sürdürülebilir bir iş kurmanın yolu bu mu? Yazar şu anda bir YC batch'inde olsaydı, muhtemelen dikey yapay zeka ürünü yapma cazibesine kapılırdı Ayrıca YC'nin "The Light Cone" podcast'inde dikey yapay zeka ürünlerini savunan çok sayıda içerik var

(lukaspetersson.com)

30 puan yazan xguru 2025-02-10 | 1 yorum | WhatsApp'ta paylaş

AI Safety girişimi Andon Labs'ın (YC w24) kurucusu Lukas Petersson'un dört bölümlük yazısının tek bir derlemesi
- Tarihsel olarak yapay zeka alanında genel amaçlı yaklaşımlar her zaman kazandı
- Bugünün AI uygulama alanındaki kurucuları, geçmişte AI araştırmacılarının yaptığı hataları tekrarlıyor
- Daha iyi AI modelleri genel amaçlı AI uygulamalarını mümkün kılacak; aynı zamanda AI modelleriyle ilişkili yazılımların katma değeri de azalacak
Bölüm 1: Tarih tekerrür eder
Bölüm 2: Rekabet avantajı yok
Bölüm 3: Tarihin ayak izleri
Bölüm 4: Siz bir büyücüsünüz

Bölüm 1: Tarih tekerrür eder (History Repeats Itself)

Kısaca:

Son dönemdeki AI ilerlemeleri, çeşitli sorunları çözen yeni ürünleri mümkün kıldı
Ancak ürünlerin çoğu mevcut modellerin sınırlı yetenekleri içinde çalışıyor; AI'nin asıl gücü olan esnekliği kullanamıyor
AI tarihi, genel amaçlı yaklaşımların her zaman kazandığını tekrar tekrar gösteriyor. Richard Sutton bunu "The Bitter Lesson"da vurguluyor
Bugünün AI kurucuları, geçmişte AI araştırmacılarının düştüğü hataları tekrarlama eğiliminde

Richard Sutton'ın şu denemesinin özeti: The Bitter Lesson. (Korece çeviri)

Şu dersleri ortaya koyuyor:
- AI araştırmacıları bilgiyi ajana entegre etmeye çalışır
- Bu kısa vadede işe yarar ve tatmin edicidir
- Uzun vadede ise ilerleme durur, hatta daha ileri gitmeyi engeller
- Sonunda, bunun tam tersi yaklaşıma dayanan hesaplama ölçeğinin büyümesiyle atılım gelir
Bu örüntünün AI araştırmalarında tekrar tekrar görüldüğünü ve bugün de sona ermediğini söylüyor

AI ürünleri ve The Bitter Lesson

AI ürünleri genel olarak bir AI modeli ve onu çevreleyen yazılımdan oluşur
Performansı artırmanın iki yolu vardır:
1. Hataları azaltmak için yazılımı kısıtlayan mühendislik çalışmaları
2. Daha iyi modellerin çıkmasını beklemek
Modeller geliştikçe mühendislik çalışmalarının değeri azalır
OpenAI'nin yeni model yayınlarıyla prompt engineering'in değerinin düşmesi buna örnek gösterilebilir

Kısıt türleri ve AI ürünleri

AI ürünlerindeki kısıtlar iki gruba ayrılabilir:
- Özgüllük: Belirli bir soruna odaklanan yazılım (dikey çözüm)
- Otonomi: AI'nin işleri kendi başına yapabilme yeteneği
Buna göre AI ürünleri sınıflandırılabilir: özgüllük (Vertical vs. Horizontal) ve otonomi (Workflow vs. Agent)
- Vertical Workflow
  - Belirli bir sorunu çözmek için sabit bir sırayla çalışan sistem
  - Harvey bunun tipik bir örneği; belirli hukuki görevler gibi dar bir alandaki sorunları işlemek üzere tasarlanmış bir workflow sistemi
- Vertical Agent
  - Belirli bir görev alanında otonom çalışan ve çalışma sırasında kendi kararlarını veren sistem
  - Devin bunun tipik bir örneği; sınırlı araç ve verilerle tekrarlayan görevleri yerine getirir ve gerektiğinde görev adımlarını ayarlar
- Horizontal Workflow
  - Çeşitli sorunları çözebilen genel amaçlı workflow sistemi
  - ChatGPT bunun tipik bir örneği; farklı türde girdilere önceden tanımlı prosedürlere göre yanıt verir ama tam otonomiye sahip değildir
- Horizontal Agent
  - Çeşitli sorunları ele alabilen tamamen otonom sistem
  - Claude computer-use bunun tipik bir örneği; şirketin standart yazılımlarını kullanarak kullanıcının talimatlarına göre çalışır ve sorunları insana benzer şekilde çözer

Vertical Workflow ile The Bitter Lesson arasındaki bağ

Demo Day'de tanıtılan ürünlerin çoğu Vertical Workflow kategorisine giriyor
- Mevcut modellerin güvenilirliği henüz yeterli olmadığından başka yaklaşımlar zor
- Karmaşık sorunları bile kabul edilebilir performans elde etmek için Vertical Workflow'a indirgeme eğilimi var
Mühendislik çalışmalarıyla bu çözümler geliştirilebilir, ancak bunun da sınırları vardır
- Mevcut modellerle çözülemeyen sorunlarda daha gelişmiş modelleri beklemek daha iyi bir strateji olabilir
- Leopold Aschenbrenner'in gözlemi: daha iyi modelleri beklemek için gereken süre, mühendislik çalışmasından daha kısa olabilir

The Bitter Lesson ile bugünkü AI ürünleri arasındaki ilişki

AI araştırmacıları, “kabul edilebilir performans” için bilgi tabanlı çözümler tasarladı; ancak sonunda daha fazla hesaplama kaynağı kullanan genel çözümler bunları geçti
Bugünkü AI ürün geliştirme yaklaşımı da bu örüntüye benziyor

Bitter Lesson'daki dört gözlem ve bunların kısıt türlerine uygulanması

Bitter Lesson'da sözü edilen dört temel gözlem, AI ürünlerindeki otonomi ve özgüllük kısıtlarında da açıkça görülür. Bunları her bir kısıt açısından açıklarsak şöyledir:

Birinci gözlem: AI araştırmacıları bilgiyi ajana entegre etmeye çalışır

Otonomi kısıtı:
- Geliştiriciler otonom ajanlar dener, ancak güvenilirlik düşüktür
- Bunun yerine görev adımlarını workflow biçiminde hard-code eder ve sistemin, kendi sorun çözme yöntemleriyle aynı prosedürü izlemesini sağlar
Özgüllük kısıtı:
- Geliştiriciler genel amaçlı bir belge analiz sistemi kurmak ister, ancak güvenilirlik sorunları yaşar
- Bunun yerine finansal tablolar gibi belirli belge türlerine odaklanır, somut metrikleri ve doğrulama kurallarını hard-code eder

İkinci gözlem: Kısa vadede etkilidir ve araştırmacıya tatmin sağlar

Otonomi kısıtı:
- Workflow'u hard-code etmek istikrarı artırır
Özgüllük kısıtı:
- Yalnızca dar kapsamlı belge ve metrikleri işleyecek şekilde uzmanlaşmak doğruluğu artırır

Üçüncü gözlem: Uzun vadede ilerleme durur, hatta engellenir

Otonomi kısıtı:
- Hard-code edilmiş workflow'lar yeni durumlarla başa çıkamaz ve bu da hatalı sonuçlara yol açar
Özgüllük kısıtı:
- Yalnızca belirli sorunları ele alan sistemler, birleştirilmiş belgeler ya da kazanç açıklaması analizi gibi ilişkili görevleri işleyemez
- Her görev için ayrı bir özelleşmiş sistem gerekir

Dördüncü gözlem: Atılım, hesaplama kaynaklarının ölçeklenmesiyle gelir

Otonomi kısıtı:
- Yeni modeller dinamik olarak uygun yaklaşımı bulur, gerektiğinde hataları düzeltir ve güvenilir otonom ajanları mümkün kılar
Reklam
Özgüllük kısıtı:
- Yeni modeller tüm iş belgelerini kapsamlı biçimde anlayıp ilgili bilgileri çıkarabilir; böylece özelleşmiş sistemlere gerek kalmaz
Otonomi gerektiren sorunlarda daha otonom ürünler daha iyi performans gösterir
Karmaşık ve geniş bir girdi alanı söz konusu olduğunda daha az özelleşmiş ürünler daha iyi sonuç verir

Sonuç: AI girişimleri ve The Bitter Lesson

Bu yazı, girişimlerin AI'deki rolünü inceleyen dört bölümlük serinin ilki; alan bilgisini kullanan AI modellerinin zamanla hesaplama kaynaklarından yararlanan modeller tarafından yerinden edildiği tarihsel örüntüyü vurguluyor
Bugünün AI ürünleri bu örüntüye şaşırtıcı derecede benziyor
Mevcut modellerin sınırlamalarını telafi etmek için yazılım geliştirmek, özellikle modellerin hızla ilerlediği bir ortamda, başarı şansı düşük bir strateji
YC partneri Jarred'in işaret ettiği gibi: ilk nesil dikey workflow LLM uygulamaları, yeni nesil GPT modelleri tarafından yerinden ediliyor
Sam Altman'ın tavsiyesi: daha iyi modellerin çıkışından korkmayan, hatta bunu bekleyebilen girişimler kurmak önemli
AI uygulama katmanındaki birçok kurucu yeni model çıkışlarını heyecanla bekliyor, ancak bu tehlikeli bir sinyal olabilir
- Daha iyi modeller çıkarsa mevcut rekabet avantajı azalabilir
- Özellikle daha zor sorunları daha etkili çözebilen ürün performansı açısından bu risk daha da belirginleşir
Bir sonraki yazı, pazar benimsenmesi denen başka bir boyutu inceleyecek ve daha iyi performansın pazarda başarıyı mutlaka garanti etmediğini tartışacak

Bölüm 2: Rekabet avantajı yok (No Powers)

tl;dr:

Yapay zeka tarihinde, model sınırlarını alan bilgisiyle telafi etmeye çalışan yaklaşımlar çoğu zaman sonunda hesaplama gücünden yararlanan daha genelleştirilmiş yaklaşımlara yenildi
Dikey AI (vertical AI), mevcut modellerin sınırlarını telafi etmek için belirli görev akışlarını (workflow) önceden tanımlayarak doğruluğu artıran bir yöntemle pazara önce giriyor
Yatay AI (horizontal AI), ChatGPT gibi genel amaçlı modelleri kullanıp sürekli gelişen bir yapı olarak, model iyileştikçe birçok alanda daha üstün performans gösterme potansiyeline sahip
Uzun vadede yatay AI, çok sayıda kısıt içeren dikey AI'ya kıyasla daha yüksek performans ve esneklik sunarak üstünlük kurabilir

Problem zorluğu ve performans eğrisi

Figure 1, dikey AI'nın pazara önce girdiği ancak modeli gelişmiş yatay AI'nın sonunda performansta onu geçtiği basit bir örneği gösteriyor
Problem zorluğunun yüksek olduğu durumlarda (Figure 2), dikey AI yeterli performansa hiç ulaşamazken çözüm ancak yatay AI geliştikten sonra mümkün hale geliyor
Bugün itibarıyla dikey AI'nın uygulanabildiği problemler görece “düşük zorluklu problemler” olduğundan, bu kategoride ilk giren avantajı elde edebilir; ancak uzun vadeli rekabet gücü belirsizdir

Yatay AI'nın sunduğu “uzaktan işbirliği yapan çalışan” kavramı

Gelecekte yatay AI, uzaktan çalışan biri gibi bilgisayar ve hesaplara erişim verilen, gerekli veriyi kendi bulup kullanabilen bir forma evrilebilir
ChatGPT gibi birçok kullanıcının zaten alışık olduğu arayüzler kademeli olarak güçlenerek şirketlerde hızlı benimsemenin önünü açabilir
Yatay AI, model her iyileştiğinde çeşitli yetenekleri anında bünyesine kattığı için, dikey AI'ya göre rekabet avantajını koruması daha kolaydır

Önceki örnek: AcademicGPT deneyimi

GPT-3.5 döneminde uzun girdi sınırını aşmak için AcademicGPT piyasaya sürüldü; ancak GPT-4 uzun girdiyi yerleşik olarak sununca mevcut çözüm hızla geçersiz hale geldi
YC partneri Jared'in dediği gibi, “İlk nesil LLM uygulamalarının çoğu bir sonraki nesil modellere yenildi”
Aynı anda birçok işlev sunan dikey AI da, model performansı geliştikçe sonunda aynı riski taşıyor

Helmer'in 7 Powers analizi

Bu bölüm, Hamilton Helmer'in 7 rekabet avantajı (Switching Costs, Counter-Positioning, Scale Economies, Network Economies, Brand Power, Process Power, Cornered Resource) üzerinden dikey AI'nın yatay AI ile rekabet edip edemeyeceğini inceliyor
Switching Cost (geçiş maliyeti)
- Kullanıcılar belirli bir dikey AI çözümünün arayüzüne veya iş akışına alışmış olsa bile, yatay AI “yeni bir çalışan işe alır gibi” basitçe onboard edilerek uygulanabilir
- ChatGPT gibi yatay AI çözümlerini halihazırda kullanan şirketlerin sayısı arttığı için, geçiş süreci zor olmayabilir
- Fiyat açısından da yatay AI, birden çok dikey çözümü birleştirebildiğinden maliyet tasarrufu sağlayabilir
Counter Positioning (ters konumlanma)
- Dikey AI, belirli bir pazara özelleşmiş çözüm olarak kişiselleştirilmiş değer sunabilir; ancak modeller geliştikçe yatay AI'nın genel olarak daha iyi performans gösterme ihtimali vardır
- Dikey AI, her yeni modeli devreye alırken mevcut “kısıtlar” nedeniyle farklılaşmasını yitirme ya da kısıtları kaldırdığında sonunda yatay modele benzemeye başlama ikilemiyle karşı karşıya kalır
Scale Economy (ölçek ekonomisi)
- Dikey AI da SaaS gibi ölçekle maliyet düşürebilir; ancak yatay AI'nın da çok sayıda alanı birleştirerek maliyetleri yayabilme avantajı vardır
- Büyük ölçekli Ar-Ge yatırımlarıyla geliştirilen yatay modellerin farklı kullanım alanlarına uygulanması, maliyet düşüşünü hızlandırabilir
Network Economy (ağ etkisi)
- Hem dikey AI hem yatay AI kullanıcı verileriyle gelişebilir; ancak yatay AI, daha geniş bir kullanıcı kitlesinden geri bildirim alarak modelin genel performansını artırma konusunda çok daha avantajlıdır
- Farklı alanlarda biriken verilerle modelin geneli iyileştiği için, dikey AI'nın yetişemeyeceği bir hızda ilerleyebilir
Brand Power (marka gücü)
- Marka gücü, küçük startup aşamasında elde edilmesi zor bir avantajdır
- OpenAI ya da Google gibi marka etkisi zaten güçlü şirketler istisna olsa da, çoğu dikey AI startup'ı marka gücünü silah olarak kullanamaz
Process Power (süreç gücü)
- Süreç gücü de büyük şirketlerin uzun zaman içinde rafine ettiği operasyonel sistemler sayesinde elde edilen bir avantajdır
- Erken aşama startup'lar için bu neredeyse geçerli bir kategori değildir
Cornered Resource (tekel niteliğinde kaynak)
- Tekel niteliğindeki kaynak, belirli veri ya da kaynağın yalnızca tek bir şirketin elinde olduğu ve bu kaynağın ilgili alanda mutlaka gerekli olduğu durumlarda büyük bir rekabet avantajı haline gelir
- Birçok AI startup'ı “özel/veriye erişim avantajı” olduğunu iddia etse de, pratikte bu veri ya gerçekten tekel niteliğinde değildir ya da o veri olmadan da model yeterince eğitilebilir
- İstisna olarak gerçekten tekel niteliğinde kaynağa sahip şirketler, yatay AI'nın gelişimine rağmen rekabet güçlerini koruyabilir
Reklam

Sonuç

Sonuç olarak, dikey AI ilk giren avantajını yakalasa bile yatay AI daha yüksek performansa ulaştığında dikey AI'nın büyük kısmını ayakta tutmak zorlaşır
Helmer'in 7 Powers çerçevesinde yalnızca gerçek bir “Cornered Resource” elde eden durumlarda dikey AI'nın uzun vadeli ivme yakalaması mümkündür
AcademicGPT'nin GPT-4 çıktıktan sonra hızla çökmesi örneğinde olduğu gibi, birçok işlevle güçlendirilmiş dikey AI da model geliştikçe sonunda benzer bir kaderle karşılaşabilir
Bir sonraki bölümde (Bölüm 3), “uzaktan işbirliği yapan çalışan” biçimindeki yatay AI'nın ne zaman ve nasıl gerçeğe dönüşebileceği; bunu engelleyen teknik, düzenleyici, güven ve ekonomik bariyerler ayrıntılı biçimde ele alınacak

Bölüm 3: Tarihte Bir Dipnot (A Footnote in History)

Anthropic CEO'sunun “virtual collaborator” kavramını açıkladığı bir röportaj yayımlandı
Bu, yazarın bu seride “horizontal AI product” dediği kavrama benziyor
OpenAI'nin yakında “Operator”ı duyurması bekleniyor ve sızan benchmark'lara göre performansı Claude'un belirgin biçimde önünde (OSWorld benchmark'ında Claude %22, Operator %38)
Bu performans artışı beklenen aralıkta ve yazar 3 ay önceki öngörüsünü aynen koruyor
Önceki bölümde, dikey AI uygulamalarının neden rekabet gücünü korumakta zorlandığı açıklandı
- Genel AI çözümleriyle arasındaki performans farkı azalıyor
- Yatay AI ürünleri rekabetçi hale geldiğinde, dikey AI ürünlerinin kendini savunmasının neredeyse yolu kalmıyor
Temel soru: “Dikey AI'dan yatay AI'ya geçiş ne zaman olacak?”
- Eğer bu 10 yıl sonra olacaksa, bugün dikey AI geliştirmek anlamlı olabilir
- Ama değişim 1-2 yıl içinde gelecekse, tamamen farklı bir strateji gerekir
Dikey AI'dan yatay AI'ya geçiş tüm sektörlerde aynı anda yaşanmayacak
Ancak bugün çoğu AI startup'ının odaklandığı pazarlar görece basit alanlar olduğundan, ana sektörlerde değişimin benzer zamanlarda gerçekleşmesi bekleniyor
2027'ye kadar çoğu sektörde dikey AI ürünlerinin hayatta kalmasının zor olacağı öngörülüyor
“Adoption”, kullanıcıların yeni bir problemi çözerken ya da mevcut bir problemin çözüm yöntemini değiştirirken hangi ürünü seçtiği anlamına geliyor
Aşağıdaki unsurlar hesaba katılmıyor
- Pazar payı: Mevcut sözleşmeler gibi etkenler rol oynayabilir
- Mutlak büyüklük: AI yeni kullanım alanları açtıkça pazar büyüyecek olsa da, bu analiz yalnızca göreli değişimi ele alıyor
- Potansiyel değer: İnsanların bugün hangi çözümü seçtiği değerlendiriliyor; gelecekteki iyileşme olasılığı dahil edilmiyor
Örneğin akış A'dan B'ye kayıyorsa, geçmişte A tercih ediliyordu ama artık B daha iyi seçenek olarak görülüyor

Dikey/yatay AI ve iş akışı/ajan kavramı

"Dikey (vertical) AI" ve "yatay (horizontal) AI", farklı AI ürün türlerini ifade eder.
"Workflow" ve "agent" da AI ürünlerini sınıflandırmak için kullanılan kavramlardır.
Bu belgede, yatay AI ürünleri içindeki workflow ve agent kavramları birlikte ele alınıyor.
- Aynı şirketin her iki işlevi de içeren bir ürün geliştirmesi büyük olasılıktır.
- Örneğin ChatGPT, agent özellikleri eklerken mevcut workflow tabanını da koruyabilir.

Geçmiş

(1) Pre-ChatGPT dönemi, geleneksel yazılımların pazara hakim olduğu bir dönemdi.
(2) ChatGPT'nin çıkışıyla birlikte ilk anlamlı yatay AI ürünü ortaya çıktı.
(3) GPT-3.5 API'nin ortaya çıkmasının ardından ilk kez AI'ya özel çeşitli dikey ürünler piyasaya sürülmeye başlandı.

Bu yıl

(4) 2025'te model performansının pratik agent'lar olarak kullanılabilecek kadar istikrarlı hale geleceği öngörülüyor.
- Şimdiye kadar yalnızca araştırma projelerinde veya sınırlı denemelerde kullanılan agent'ların artık ciddi biçimde devreye alınması bekleniyor.
- Mevcut dikey workflow ürünlerinin de AI agent formatına dönüşme ihtimali var.
(5) Agent'lar ortaya çıksa bile 2025'e kadar dikey workflow'ların baskın konumunu koruması bekleniyor.
- Kullanıcıların halihazırda kullandıkları araçları değiştirmek istememesi ve geliştiricilerin şimdiye kadar oluşturdukları mühendislik varlıklarını kullanmayı sürdürme eğilimi bunda etkili oluyor.
(6) ChatGPT, Claude ve Gemini gibi başlıca yatay AI ürünlerinin yeteneklerini genişleterek daha fazla dikey alanı kapsaması bekleniyor.
- Dikey AI ürünlerinin mevcut uzmanlaşmış özellikleri, yatay AI ürünlerine hızla dahil olabilir.
- ChatGPT'nin masaüstü uygulamalarıyla entegrasyona şimdiden başlamış olması buna örnek.

Yakın gelecek

(7) Yatay AI agent'ları ile insan çalışanlar arasındaki yetenek farkının giderek daralacağı öngörülüyor.
- Uzman seviyesine ulaşmasa bile, genel ofis işlerinin önemli bir kısmını otomatikleştirebilecek performansa erişmesi bekleniyor.
- Bu da dikey AI çözümlerinin varlık nedenini zayıflatabilir.
- Somut örnekler:
  - Bireysel kullanıcılar vergi beyanı veya iş başvurusu hazırlığı gibi karmaşık işleri yatay agent'lara bırakabilir.
  - Şirketler junior seviyedeki çalışanların önemli bir bölümünü ikame edebilir veya azaltabilir.
  - Tek bir kişinin unicorn değer yaratabildiği örnekler ortaya çıkabilir.
(8) Geleneksel yazılımların, agent'ların kullanabileceği bir arayüz olarak değerini korumaya devam edeceği düşünülüyor.
- Agent'ların tüm yazılımları sıfırdan yeniden üretmesindense mevcut yazılımları kullanması daha maliyet etkin olabilir.
- Özellikle genel amaçlı ve yatay yazılımların hayatta kalma olasılığının daha yüksek olduğu değerlendiriliyor.
(9) Hayatta kalacak dikey AI ürünlerinin, 2. bölümde anılan savunmacı kaynaklara (özel/veri tekeli, patent vb.) sahip az sayıdaki örnek olması bekleniyor.
- Bu şirketler, söz konusu kaynakları yüksek değerlerle satma imkanına da sahip olabilir.
Reklam

2024 - İlerleme durdu mu?

2024'te AI modellerinde bir duraklama yaşandığı iddiası ikna edici bulunmuyor.
- o3'ün çıkışından önce de GPT-4, Claude ve Open Weight modelleri dahil çeşitli alanlarda model performansı istikrarlı biçimde gelişmeye devam etti.
- ARC-AGI, GPQA Diamond gibi ölçütlerde benchmark skorları radikal biçimde yükseldi.
Anthropic'in Claude 2'den Claude 3'e ve ardından Claude 3.5 Sonnet'e hızlı bir evrim geçirdiği, ayrıca açıklanmayan yükseltmeleri şirket içinde kullandığı yönünde tahminler bulunuyor.
Bu nedenle 2024'ün AI model iyileştirmelerinin durduğu yıl olduğu iddiasını destekleyen yeterli dayanak olmadığı görüşü öne çıkıyor.

Olası engeller

Model Stagnation: 2024'te duraklama olmasa da 2025 sonrasında model gelişiminin yavaşlayabileceği veya durabileceği endişesi var.
- Ilya Sutskever, NeurIPS'te geleneksel pre-training yaklaşımının sınırlarına değindi; ancak aynı zamanda test-time compute gibi başka yolların da bulunduğunu ima etti.
- Önde gelen AI araştırma kurumları ve şirketleri hâlâ büyük ölçekli hesaplama kaynaklarına agresif biçimde yatırım yapıyor.
Regulation: Beklenmedik düzenlemeler ortaya çıkarsa AI gelişimi kısıtlanabilir.
Trust Barriers: Kullanıcıların agent'ların güvenliği ve güvenilirliği konusunda çekinceleri var.
- Geçmişte asansör otomasyonuna dair korkuların zamanla ortadan kalkmış olması, bunun da aşılabileceğine işaret ediyor.
AI Labs Hesitate: Anthropic veya OpenAI gibi kuruluşlar, gerçek teknik kapasiteye sahip olsalar bile kullanıcı etkileşimini kısmen sınırlı tutmayı tercih edebilir.
Expensive Inference: o3 örneğinde olduğu gibi yüksek performanslı çıkarım çok yüksek maliyet gerektirebilir.
- Ancak çıkarım maliyetleri zamanla düşüyor ve agent'ların her görevde aynı düzeyde yüksek performanslı çıkarımı kullanması gerekmeyebilir.
Tüm bu unsurlar birlikte değerlendirildiğinde, teknolojik ilerlemeyi öngörmek zor olsa da dikey AI startup'larının önünde fazla zaman kalmadığı düşünülüyor.
AI modelleri gelişmiş hale geldikçe, mevcut mühendislik tabanlı değerin hızla yok olabileceğini gösteren U biçimli bir değer eğrisi sunuluyor.

Notlar

o3'te görülen test-time compute ölçeklenmesinin, mevcut araştırmalar temelinde zaten öngörülebilen bir sonuç olduğu belirtiliyor.
AlphaZero örneğinde görüldüğü gibi, doğrulanabilir ortamlarda performans çok hızlı biçimde insanüstü seviyeye ulaşabiliyor.
o3'ün kodlama ve matematik gibi alanlarda güçlü olmasına karşın, yaratıcı yazarlık gibi diğer alanlarda o1'e kıyasla büyük bir fark göstermediği değerlendirmesi yapılıyor.
Gelecekte yeni bir dikey AI geliştirmektense, daha geniş kapsamlı veya daha özel kaynakları ele alan başka yönelimlerin girişimciler için daha avantajlı olabileceği ima ediliyor.

Bölüm 4: Siz bir büyücüsünüz (You’re a wizard Harry)

Kurucu, bir büyücü gibidir

Yoktan var etme yeteneğine sahiptir.
Yeni bir şirket başlatmak için özgün düşünce gerekir.
Paul Graham'ın (PG) sözü: "Fikirler yalnızca doğru değil, aynı zamanda özgün de olmalıdır. Herkesin iyi fikir olduğunu kabul ettiği bir şeyi başlatmamalısınız."
Pek çok kurucu, akranlarının etkileyici gelir artışına kapılıp bağımsız düşünme yetisini kaybediyor.
Herkes aynı şeyi yapıyor ve bunun işe yaradığı görülüyorsa, bağımsız düşünmek zorlaşıyor.
Yazar, bağımsız düşünmeye çalıştığını ve bu fikirlerin kulağa kötü gelmesini umduğunu söylüyor.

Yatay agent'ların geleceği ve rekabet

AI uygulama katmanına hakim olacak yatay agent'ların AI laboratuvarları tarafından geliştirileceği öngörülüyor.
Model performansındaki farklar tek bir kazanan yaratabilir, ancak Anthropic, OpenAI, GDM ve xAI arasında sert rekabet yaşanması daha olası görülüyor.
Bu durum kısa vadede son kullanıcı için faydalı bir fiyat rekabetine yol açıyor.
AI laboratuvarları kısa vadede çok büyük finansal değeri yakalayamasa bile, yine de son derece güçlü bir konumda olacakları düşünülüyor.
Bu nedenle kurucuların, startup'larını bu laboratuvarlarla olan ilişki bağlamında değerlendirmesi mantıklı görülüyor.

Müşteri olarak yaklaşım

1. bölümde tartışıldığı gibi, LLM API kullanan AI dikey ürünleri inşa etmek mümkündür; ancak bu yalnızca önemli kaynaklara münhasır erişim olduğunda mümkündür.
AI dikey ürünü inşa etmek için, bu tür kaynakları bulmaya olağanüstü çaba harcamak gerekir.

Rakip olarak yaklaşım

Eğer geleceği yatay ajanlar temsil ediyorsa, neden bunu inşa etmeyelim? Üç yaklaşım inceleniyor
Pazarı önce ele geçirmek
- Yapay zeka laboratuvarları, ancak modeller yeterince güvenilir hâle gelip minimum mühendislik çabasıyla yatay ajanlar kurulabildiğinde dikey iş akışlarıyla ciddi biçimde rekabet edecek
- Önceki modellere mühendislik çabası uygulanarak teorik olarak laboratuvarlardan önce pazara girilebilir, ancak bu kesin değil
- Leopold Aschenbrenner, bu çabanın bir sonraki modeli inşa etmekten daha uzun sürebileceğini düşünüyor: "uzaktan çalışanların birçok işi otomatikleştirebilmesi zaman alabilir ve bu sırada ara modeller hâlâ tam olarak kullanılmamış ve entegre edilmemiş olabilir"
- Pazara önce kim girerse girsin, bu avantajın uzun sürmemesi bekleniyor
Ajan API wrapper'ı
- Ev arkadaşı, "dünyada UI becerisine sahip kimse yok mu?" diye sormuş
- Bu iki soruna işaret ediyor: 1) API maliyetleri nedeniyle marjlar sürdürülemez, 2) laboratuvarlar en iyi modellerini açmıyor (ChatGPT arama, web browsing vb. için özel modeller kullanıyor)
- Şu anda GPT API kullanarak ChatGPT ile doğrudan rekabet eden kimse yok ve bu kalıbın yatay ajanlarda da tekrarlanması bekleniyor
Açık kaynak modeller
- Açık kaynak modeller başka bir yol sunabilir
- Perplexity, laboratuvarlarla yatay ürün alanında rekabet etmenin mümkün olduğunu gösteriyor
- Ancak açık kaynak modeller basit benchmark'larda iyi performans gösterse de karmaşık ajan görevlerinde zorlanıyor
- Llama-3.1-405b, MLE-bench'te state-of-the-art modellere kıyasla belirgin biçimde geride kalıyor
- Andon Labs bu tür benchmark'larda uzmanlaşıyor ve bu da bizim gördüklerimizle örtüşüyor
- Deepseek V3 ve R1 çok etkileyici sonuçlarla yayımlandı, ancak o3 de öyle ve Anthropic'in içeride daha iyi sürümlere sahip olduğu biliniyor
- Açık kaynak modellerin state-of-the-art'a yaklaşması mümkün olabilir, ancak onu aşacakları şüpheli
- Yine de yatay oyunda rekabet etmek için yeterli olabilir
- Çıkarım maliyetleri hâlâ çok yüksek olacak

Tedarikçi olarak yaklaşım

Eğer yapay zeka laboratuvarları gerçekten bu kadar güçlü hâle gelirse, onlara tedarikçi olmak harika bir konum olur
Açıkça çok fazla hesaplama gücüne ve elektriğe ihtiyaç duyacaklar
Leo'nun analizi doğruysa, beklenenden de fazlasına ihtiyaç duyabilirler
Bu fırsat sektörel uzmanlık gerektiriyor ve bu, şu anda yapay zeka uygulama katmanındaki girişimciler için doğal bir alan olmayabilir
Ama senin bir büyücü olduğunu unutma
Laboratuvarlar ayrıca üçüncü taraflardan veri satın alıyor
Scale AI, bunun harika bir iş olduğunu kanıtlıyor
Ancak yapay zeka laboratuvarlarının "self-play"i çalıştırıp çalıştıramayacağı şüpheli
AlphaZero dış veri olmadan eğitildi ve bu, gelecekteki yapay zeka modelleri için kutsal kâse olarak görülüyor
Eğer self-play'i çalıştıramazlarsa, alternatif muhtemelen birden çok sonradan eğitim veri setini birleştirmek olacaktır
Bu dünyada veri satmak muhtemelen iyi bir seçenek olur

Ekosistem katkıcısı olarak yaklaşım

Yapay zeka laboratuvarlarıyla ilişkide değerlendirilmeye değer son seçenek ekosistem katkıcısı olmak
Bu, yatay ajanlara yardımcı olan araçlar inşa etmek anlamına geliyor, ancak kritik nokta bunun ajanın kendisinden ayrı olması gerektiği
Bölüm 3'te gösterildiği gibi, ajanların verimli arayüzlere ihtiyacı olduğu için geleneksel yazılım varlığını sürdürecek
Ajanlar kendi yazılımlarını yazabilir, ancak çıkarım maliyetleri bunu pratik olmaktan çıkarabilir
Ancak ekosistem oyuncuları emtialaşma riski taşır ve değerin büyük kısmı başka yerde yakalanabilir
Bu, yatay ajanları çalıştırmanın çıkarım maliyetinin (inference cost) ne kadar yüksek olduğuna bağlı olacak
- Eğer çıkarım maliyeti düşükse, ajanların ihtiyaç duydukları yazılımı kendilerinin üretmesi daha yaygın olacaktır

Ya yapay zeka yatay ajanları geç gelirse?

Zaman çizelgesi (timeline) çok önemli
- Eğer yatay ajanlar ancak 10 yıl sonra rekabetçi hâle gelecekse, bugün dikey yapay zeka iş akışları kurmak harika bir fikir olur
- Bu kadar süre, büyük ve sağlam bir şirket kurmak için yeterlidir
Ancak yapay zeka laboratuvarlarının ilerleme hızına bakınca 10 yıl gerçekçi görünmüyor
- Peki 4 yıl sonra ne olur?
- 4 yıl büyük bir şirket kurmak için yetersiz olabilir, ama yeterli yineleme (iteration) fırsatı sunar
- Yapay zeka uygulama katmanında başlamak, sonrasında vendor veya ekosistem oyuncusuna dönüşmek için avantajlı olabilir

Sonsöz: YC(Y Combinator)'nin hatası mı?

Yüzeyden bakıldığında YC yanlış seçimler yapıyor gibi görünebilir
- Şu anda YC yatırımlarının çoğunu dikey yapay zeka ürünlerine yoğunlaştırıyor
- Ancak bu pazarın yakında ortadan kalkma ihtimali yüksek
Ancak yazarın VC (girişim sermayesi) konusunda uzmanlığı yok, bu yüzden kesin bir sonuca varmıyor
- Sadece kafası karışık ve düşüncelerini paylaşıyor
YC, nispeten tarafsız bir yatırım stratejisi izlediğini söylüyor
- Zeki insanlara yatırım yapıyor ve en iyi fikirleri onların bulmasını umuyor
- Bu harika bir strateji ve yüzlerce kurucu geleceği 14 YC partnerinden daha iyi öngörebilir
Ancak yazar, YC'nin batch sisteminin kısa vadeli düşünmeyi teşvik edebileceğinden endişe ediyor
- YC'de haftalık hedefler koymak çok önemli ve büyük bir grup içinde ilerlemek motivasyon açısından iyi
- Ancak fikir çeşitliliği yeterli değilse, bu kısa vadeli düşünmeyi teşvik edebilir
- Dikey yapay zeka ürünleri yaparak hızla 5.000 dolar MRR seviyesine ulaşılabilir
- Ama sürdürülebilir bir iş kurmanın yolu bu mu?
- Yazar şu anda bir YC batch'inde olsaydı, muhtemelen dikey yapay zeka ürünü yapma cazibesine kapılırdı
- Ayrıca YC'nin "The Light Cone" podcast'inde dikey yapay zeka ürünlerini savunan çok sayıda içerik var

1 yorum

zkdlfrlwl2 2025-02-14

Vertical AI ile Horizontal AI ayrımı ve açıklaması ilgi çekici görünüyor.