Generative AI’nin Act o1’i - Ajan muhakemesi çağının başlangıcı

xguru · 2024-10-21T11:06:01+09:00

Generative AI devriminin ikinci yılına girilirken, araştırmalar "hızlı düşünme"den "yavaş düşünme"ye evriliyor "Hızlı düşünme", önceden eğitilmiş hızlı yanıtları ifade ederken, "yavaş düşünme" inference sırasında reasoning yapılmasını ifade ediyor Bu evrim nedeniyle yeni tür ajan uygulamaları ortaya çıkıyor Generative AI pazarının temel katmanı istikrar kazanırken Microsoft/OpenAI, AWS/Anthropic, Meta, Google/DeepMind gibi az sayıdaki büyük oyuncu pazara yön veriyor Yalnızca ekonomik motora ve devasa sermayeye sahip büyük şirketler rekabette kalabiliyor Pazar yapısının kendisi sağlamlaşıyor ve ucuz, bol miktarda next-token tahmini mümkün hale gelecek LLM pazar yapısı istikrar kazanırken yeni bir frontier ortaya çıkıyor Odak, "System 2" düşünme biçimini önceleyen reasoning katmanının geliştirilmesi ve ölçeklenmesine kayıyor AlphaGo gibi modellerden ilham alan bu katman, basit pattern matching'in ötesine geçerek dikkatli muhakeme, problem çözme ve bilişsel işlevleri yapay zeka sistemlerine kazandırmayı hedefliyor Yeni bilişsel mimariler ve kullanıcı arayüzleri, bu reasoning yeteneklerinin kullanıcıya nasıl sunulduğunu ve nasıl etkileşime girdiğini şekillendiriyor Strawberry Fields Forever 2024'ün en önemli model güncellemesi OpenAI'nin o1'i (önceden Q* olarak biliniyordu, Strawberry olarak da anılıyordu) Bu, yalnızca OpenAI'nin model kalite sıralamalarında üst sıralara çıkması değil, aynı zamanda mevcut mimaride kayda değer bir iyileşme sağlaması anlamına geliyor Daha somut olarak bu, reasoning-time compute ile elde edilen gerçek bir "genel muhakeme yeteneği"ne sahip ilk model Ön eğitimli model vs reasoning-time compute Ön eğitimli modeller, çok büyük miktarda veri kullanarak next token prediction gerçekleştirir Ölçeğin ortaya çıkardığı özelliklerden biri temel düzeyde muhakemedir, ancak bu muhakeme oldukça sınırlıdır Reasoning-time compute, modele yanıt vermeden önce durup düşünmesinin istenmesi anlamına gelir Bunun için inference sırasında daha fazla compute gerekir "Durup düşünme" kısmı tam olarak reasoning'dir AlphaGo ve LLM karşılaştırması AlphaGo, 2016 Mart'ında Seul'de baduk efsanesi Lee Sedol ile karşılaşarak derin öğrenme tarihinin en önemli anlarından birini yarattı AlphaGo, dünyaya sadece pattern taklit eden değil, "düşünen AI" görünümünü gösterdi AlphaGo ile önceki oyun oynayan AI sistemleri arasındaki fark AlphaGo da LLM'ler gibi yaklaşık 30 milyon önceki oyun hamlesinden oluşan bir veritabanı ve self-play üzerinden insan uzmanları taklit edecek şekilde önceden eğitildi Ancak ön eğitimli bir modelden gelen anlık tepkiyi vermek yerine AlphaGo zaman ayırıp duruyor ve düşünüyor Inference sırasında AlphaGo, çok sayıda potansiyel gelecek senaryo için search veya simulation çalıştırıyor, bu senaryoları değerlendiriyor ve ardından beklenen değeri en yüksek olan senaryoya (veya yanıta) göre cevap veriyor AlphaGo'ya ne kadar çok zaman verilirse performansı o kadar artıyor Hiç reasoning-time compute olmadan AlphaGo en iyi insan oyuncuları yenemiyor LLM'lerde AlphaGo'yu kopyalamanın neden zor olduğu Yanıtı değerlendiren bir value function oluşturmak zor Baduk'ta oyunu sonuna kadar simüle edip kimin kazandığını görebilir, ardından bir sonraki hamlenin beklenen değerini hesaplayabilirsiniz Kodlamada kodu test edip çalışıp çalışmadığını görebilirsiniz Ancak bir makale taslağı, seyahat planı veya uzun bir belgedeki temel terimlerin özeti gibi çıktıları değerlendirmek zordur Bu, mevcut metodolojilerle reasoning'in neden zor olduğunu ve Strawberry'nin mantığa yakın alanlarda (ör. kodlama, matematik, bilim) görece güçlü, açık uçlu ve yapılandırılmamış alanlarda (ör. yazı yazma) ise neden daha zayıf olduğunu açıklar Strawberry modelinin reasoning yeteneklerini geliştirmeye yönelik araştırmalar Strawberry'nin gerçek uygulaması sıkı şekilde korunuyor olsa da, temel fikir modelin ürettiği düşünce zinciri üzerinde yapılan reinforcement learning ile ilgili Modelin düşünce zincirini denetlemek, insanın düşünme ve muhakeme biçimine benzer şekilde temel ve ilgi çekici bir şeylerin gerçekleştiğine işaret ediyor Örneğin o1, reasoning-time scaling'in ortaya çıkan bir özelliği olarak tıkandığında geri dönebilme yeteneği gösteriyor Ayrıca insan gibi problem üzerine düşünebilme (ör. bir geometri problemini çözmek için küre üzerindeki noktaları görselleştirme) ve probleme yeni biçimlerde yaklaşabilme (ör. bir programlama yarışması problemini insanlardan farklı bir şekilde çözme) yeteneği sergiliyor Araştırma ekibinin, modelin reasoning yeteneklerini artırmak için ödül fonksiyonu hesaplamaya yönelik yeni yöntemler ve generator/verifier açığını kapatmaya yönelik yeni yaklaşımlar dahil olmak üzere reasoning-time compute'u ilerletecek pek çok fikri bulunuyor Kısacası, derin reinforcement learning yeniden ilgi odağına giriyor ve bu da genel olarak yeni bir reasoning katmanını mümkün kılıyor System 1'den System 2 Thinking'e sıçrayış Önceden eğitilmiş içgüdüsel tepkilerden ("System 1") daha derin ve dikkatli muhakemeye ("System 2") geçiş, yapay zekada bir sonraki frontier olarak öne çıkıyor Modelin sadece bir şeyi biliyor olması yeterli değil Modelin gerçek zamanlı kararlar vermek için durması, değerlendirmesi ve muhakeme yürütmesi gerekiyor Ön eğitim, System 1 katmanına karşılık gelir İster AlphaGo'da milyonlarca baduk hamlesi öğrenilsin ister LLM'lerde internet ölçeğinde petabaytlarca metin öğrenilsin, ön eğitimin amacı insan oyununu ya da dili gibi kalıpları taklit etmektir Ancak taklit, ne kadar güçlü olursa olsun, gerçek muhakeme değildir Özellikle eğitim veri kümesinin dışındaki karmaşık ve yeni durumlarda düzgün şekilde düşünemez System 2 düşünme, güncel AI araştırmalarının odak noktası Model "durup düşündüğünde", yalnızca öğrenilmiş kalıpları üretmiyor veya geçmiş verilere dayalı tahminleri dışa vurmuyor Olasılık aralığı üretiyor, potansiyel sonuçları değerlendiriyor ve muhakemeye dayalı kararlar veriyor System 1 düşünme ile System 2 düşünmenin uygun kullanımı Birçok görevde System 1 düşünme yeterlidir (ör. Bhutan'ın başkentinin ne olduğu konusunda daha uzun düşünmek yardımcı olmaz) Ancak matematikte ya da biyolojide bir atılım gibi daha karmaşık problemlerde hızlı ve içgüdüsel tepkiler yetersiz kalır Bu tür ilerlemeler derin düşünme, yaratıcı problem çözme ve her şeyden önemlisi zaman gerektirir AI için de durum aynıdır. En zor ve en anlamlı problemleri çözmek için, hızlı öğrenilmiş veri kümesi içi tepkilerin ötesine geçip insan ilerlemesini tanımlayan o düşünceli muhakemeyi üretmek üzere zaman ayırması gerekir Yeni ölçekleme yasası: reasoning rekabetinin başlangıcı OpenAI'nin o1 makalesindeki en önemli içgörü, yeni bir ölçekleme yasasının ortaya çıkmış olması LLM ön eğitiminin ölçekleme yasası LLM ön eğitimi iyi anlaşılmış bir ölçekleme yasasını takip eder Modelin ön eğitimi için ne kadar fazla compute ve veri kullanılırsa performans o kadar yükselir Reasoning-time compute için yeni ölçekleme yasası o1 makalesi, compute ölçeklendirmesi için yeni bir boyut açtı Modele ne kadar fazla reasoning-time (veya "test time") compute verilirse muhakeme yeteneği o kadar gelişir Modelin saatlerce, günlerce, onlarca yıl düşünebildiğini varsaysak ne olur? Riemann hipotezini çözebilir mi? Asimov'un son sorusuna yanıt verebilir mi? Büyük ölçekli ön eğitim kümelerinden reasoning cloud'a geçiş Bu değişim bizi büyük ölçekli ön eğitim cluster'ları dünyasından reasoning cloud'a taşıyacak Reasoning cloud, görevin karmaşıklığına göre compute'u dinamik biçimde ölçekleyebilen bir ortamdır Tek bir model her şeye hakim olacak mı? OpenAI, Anthropic, Google ve Meta gibi şirketler muhakeme katmanını genişletip daha güçlü muhakeme makineleri geliştirdikçe ne olacak? Tek bir model her şeye hakim olacak mı? Bir hipotez, tek bir model şirketinin aşırı güçlü hale gelerek diğer tüm uygulamaları içine çekeceği yönündeydi Bu öngörünün şimdiye kadar iki açıdan yanlış olduğu ortaya çıktı Birincisi, model katmanında SOTA yetenekleri için sürekli yarışan çok sayıda rakip var Birinin geniş alanlı self-learning yoluyla sürekli kendini geliştirmeyi başarıp sıçrama yapması mümkün, ancak henüz buna dair bir kanıt yok Aksine, model katmanı kıyasıya rekabetin yaşandığı bir alan ve GPT-4'ün token başına fiyatı geçen Developer Day'den bu yana %98 düştü İkincisi, modeller uygulama katmanına ilerlemekte zorlanıyor ChatGPT dışında, modeller uygulama katmanında çığır açan ürünler haline gelmekte genel olarak başarısız oldu Çünkü gerçek dünya karmaşıktır Harika araştırmacılar, mümkün olan her dikey pazardaki her olası özelliğin ayrıntılı uçtan uca iş akışlarını anlamak istemez Araştırmacıların API seviyesinde durup gerçek dünyanın karmaşıklığını geliştirici ekosistemine bırakması hem cazip hem de ekonomik olarak mantıklı Bu, uygulama katmanı için iyi haber Karmaşık gerçek dünya: özelleştirilmiş bilişsel mimariye duyulan ihtiyaç Bir bilim insanı olarak hedeflere ulaşmak için eylemleri planlama ve yürütme biçimi ile bir yazılım mühendisi olarak çalışma biçimi büyük ölçüde farklıdır Ayrıca farklı şirketlerde yazılım mühendisi olarak çalışma biçimleri de birbirinden farklıdır Laboratuvarlarda yatay genel amaçlı muhakemenin sınırları daha da zorlanıyor, ancak yararlı AI ajanları sunmak için hâlâ uygulamaya veya alana özgü muhakemeye ihtiyaç var Karmaşık gerçek dünya, genel modellere verimli biçimde kodlanamayan önemli ölçüde alan ve uygulama özelinde muhakeme gerektirir Bilişsel mimarinin ortaya çıkışı Bilişsel mimari, sistemin düşünme biçimini, yani kullanıcı girdisini alıp eylem gerçekleştiren veya yanıt üreten kod ve model etkileşimlerinin akışını ifade eder Örneğin Factory'de her bir "droid" ürünü, pull request incelemesi ya da backend servisler arası güncellemeler için migration planı yazıp uygulamak gibi belirli görevleri çözmek amacıyla insanların düşünme biçimini taklit eden özelleştirilmiş bir bilişsel mimariye sahiptir Factory droid'leri tüm bağımlılıkları analiz eder, ilgili kod değişiklikleri önerir, unit test'ler ekler ve inceleme için bir insanı sürece dahil eder Ardından onaydan sonra geliştirme ortamındaki tüm dosyalarda değişiklikleri uygular, tüm testler geçerse kodu merge eder Bu, genelleştirilmiş ve kara kutu gibi tek bir yanıttan ziyade, bir dizi ayrı görevden oluşan insan düşünme biçimine benzer App tarafında neler oluyor? Bir AI işi kurmak için hangi katman hedeflenmeli? Altyapı katmanında rekabet etmek için NVIDIA ve hyperscaler'ları yenmek gerekir Model katmanında rekabet etmek için OpenAI ve Mark Zuckerberg'i yenmek gerekir Uygulama katmanında rekabet etmek için kurumsal BT'yi ve küresel sistem entegratörlerini yenmek gerekir Uygulama katmanındaki rekabet en uygulanabilir olan gibi görünüyor Uygulama katmanındaki fırsat Temel modeller sihir gibi görünse de karmaşıktır Ana akım işletmeler kara kutularla, halüsinasyonlarla ve hantallık gösteren iş akışlarıyla başa çıkamaz Tüketiciler boş bir prompt gördüğünde ne istemeleri gerektiğini bilmez Bu, uygulama katmanının fırsatıdır İki yıl önce birçok uygulama katmanı şirketi, "GPT-3 üzerine kurulmuş bir wrapper'dan ibaret" diye eleştiriliyordu Bugün bu wrapper'lar, sürdürülebilir değer inşa etmenin az sayıdaki sağlıklı yolundan biri olarak ortaya çıktı "Wrapper" diye başlayan şey, "bilişsel mimari"ye evrildi Uygulama katmanındaki AI şirketlerinin özellikleri Sadece temel modelin üstüne bir UI koymaktan ibaret değildir Genellikle şunları içeren sofistike bir bilişsel mimariye sahiptirler: Üstte bir tür routing mekanizması bulunan birden fazla temel model RAG için vektör ve/veya graph veritabanları Uyumluluğu sağlamak için guardrail'ler İş akışları üzerinden muhakeme biçimini taklit eden uygulama mantığı Service-as-a-Software Buluta geçiş, "Software-as-a-Service" idi. Yazılım şirketleri bulut hizmet sağlayıcılarına dönüştü ve bu 350 milyar dolarlık bir fırsattı Ajan muhakemesi sayesinde AI dönüşümü, "Service-as-a-Software" haline geliyor. Yazılım şirketleri emeği yazılıma dönüştürüyor Bu, hedef pazarın yazılım pazarı değil, trilyonlarca dolarlık hizmet pazarı olduğu anlamına geliyor İş satmanın anlamı Sierra adlı şirket buna iyi bir örnek B2C şirketleri müşterileriyle konuşmak için Sierra'yı kendi web sitelerine yerleştiriyor Yapılması gereken iş (job-to-be-done), müşteri sorunlarını çözmektir Sierra, çözülen sorun başına ücret alır "Seat" diye bir şey yoktur. Ortada yapılması gereken bir iş vardır, Sierra o işi üstlenir ve buna göre ücret alır Bu, birçok AI şirketi için gerçek kuzey yıldızıdır Sierra'nın avantajı ve diğer şirketlerin zorlukları Sierra'nın zarif bir başarısızlık modunun avantajı vardır: insan müşteri temsilcisine escalation Her şirket bu kadar şanslı değil Yeni kalıp, önce pilot olarak human-in-the-loop ile devreye almak, ardından bu deneyimden yararlanarak autopilot yani human-out-of-the-loop dağıtımı için fırsat bulmaktır GitHub Copilot buna iyi bir örnektir Yeni tür ajan uygulamaları ortaya çıkmaya başladı Generative AI'nin yeni muhakeme yetenekleriyle birlikte yeni tür ajan uygulamaları ortaya çıkmaya başladı İlginç biçimde, bu uygulama katmanı şirketleri önceki bulut şirketlerinden farklı görünüyor: Bulut şirketleri yazılım gelirini hedeflerken, AI şirketleri hizmet gelirini hedefliyor Bulut şirketleri yazılım ($/seat) satarken, AI şirketleri iş ($/sonuç) satıyor Bulut şirketleri sürtünmesiz dağıtımla bottom-up yaklaşımını tercih ederken, AI şirketleri giderek daha fazla high-touch, high-trust teslim modeliyle top-down yaklaşıma yöneliyor Bilgi ekonomisinin tüm sektörlerinde ortaya çıkan ajan uygulamalarına örnekler Harvey: AI avukatı Glean: AI iş asistanı Factory: AI yazılım mühendisi Abridge: AI tıbbi kayıt uzmanı XBOW: AI penetration tester Sierra: AI müşteri destek ajanı Bu hizmetleri sunmanın marjinal maliyeti, muhakeme maliyetlerindeki sert düşüşle aynı seviyelere indirilerek ajan uygulamaları yeni pazarları genişletiyor ve yaratıyor XBOW buna iyi bir örnek: XBOW, AI "pentester" geliştiriyor "Pentest" ya da penetration testing, şirketlerin kendi güvenlik sistemlerini değerlendirmek için gerçekleştirdiği, bilgisayar sistemlerine yönelik simüle edilmiş bir siber saldırıdır Generative AI'den önce insan eliyle yapılan pentest pahalı olduğu için (vasıflı personelin yaptığı manuel bir iş), şirketler yalnızca sınırlı durumlarda, örneğin mevzuat uyumluluğu gerektiğinde pentester işe alıyordu Ancak XBOW artık en güncel muhakeme LLM'lerine dayanan otomatik pentest gösterimleri yapıyor ve bu, en yetenekli insan pentester'ların performansına rakip oluyor Bu da pentest pazarını büyütüyor ve her ölçekten ve her yapıdaki şirket için sürekli pentest olanağının önünü açıyor Bunun SaaS sektörüne etkisi ne? Bu yılın başında LP’lerle görüştüğümüzde en sık aldığımız soru, “Yapay zeka dönüşümü mevcut bulut şirketlerini yıkacak mı?” oldu Biz güçlü bir başlangıç varsayımı olarak “hayır” ile yola çıktık Startup’larla yerleşik şirketler arasındaki klasik mücadele, startup’ların dağıtım kurup yerleşik şirketlerin ürün geliştirdiği bir yarışa benzer Müşteriye sahip olan yerleşik şirketler harika bir ürün çıkarmadan önce, harika ürüne sahip genç şirketler müşteriye ulaşabilir mi? Yapay zekanın büyüsünün büyük ölçüde foundation model’lerden geldiği düşünüldüğünde, temel varsayımımız “hayır”dı Yerleşik şirketler de startup’lar kadar foundation model’lere erişebiliyor ve veri ile dağıtım tarafındaki mevcut avantajlara sahip oldukları için başarılı olacaklardır Startup’lar için asıl fırsat, mevcut yazılım şirketlerini yerinden etmekten çok otomasyona uygun iş havuzlarını hedeflemektir Ancak artık bundan o kadar emin değiliz Yukarıda bilişsel mimari hakkında söylenenlere bakın Modelin ham yeteneklerini ikna edici ve güvenilir uçtan uca iş çözümlerine dönüştürmek için muazzam miktarda mühendislik gerekiyor “AI native” olmanın ne anlama geldiğini dramatik biçimde hafife alıyor olabilir miyiz? 20 yıl önce on-premise yazılım şirketleri SaaS fikrine burun kıvırıyordu “Önemsiz. Kendi sunucularımızı da işletip bunu internet üzerinden sunabiliriz!” Kavramsal olarak basitti, ancak ardından işin baştan sona yeniden icadı geldi: EPD, waterfall model ve PRD’den agile geliştirme ve AB testing’e geçti GTM, tepeden inme kurumsal satış ve biftekli akşam yemeklerinden aşağıdan yukarıya PLG ve ürün analitiğine geçti İş modeli, yüksek ASP ve bakım gelir akışlarından yüksek NDR ve kullanıma dayalı fiyatlamaya geçti On-premise şirketlerden çok azı bu dönüşümü başarıyla gerçekleştirebildi Yapay zeka, SaaS’a benzer bir dönüm noktası olabilir mi? Yapay zekadaki fırsat, hem işi satarken aynı anda yazılımın yerini almak olabilir mi? Day.ai üzerinden geleceğe kısa bir bakış atabildik Day, AI native bir CRM’dir Sistem entegratörleri, Salesforce’u müşterilerin ihtiyaçlarına göre yapılandırarak milyarlarca dolar kazanıyor Day ise yalnızca e-posta ve takvime erişim ile tek sayfalık bir anketin yanıtlarından hareketle, müşterinin işine mükemmel uyum sağlayan bir CRM’i otomatik olarak oluşturuyor Henüz tüm özelliklere sahip değil, ancak insan müdahalesi olmadan sürekli güncel kalan otomatik oluşturulmuş CRM’in büyüsü şimdiden insanları geçiş yapmaya ikna ediyor Yatırım sektörü Yatırımcılar zamanlarını ve sermayelerini nereye ayırıyor? Altyapı Bu alan hyperscaler’ların sahasıdır Ekonomik analizden çok oyun teorisine dayalı davranışlarla yönlendirilmektedir Venture yatırımcıları için uygun bir alan değildir Model Hyperscaler’ların ve finansal yatırımcıların (FI) faaliyet gösterdiği alandır Hyperscaler’lar, varlık bilançolarını kullanarak getiri elde etmek ve bunun bulut işinde hesaplama maliyeti olarak geri dönmesi mantığıyla yatırım yapar Finansal yatırımcılar ise “bilime hayran olma” yanlılığından etkilenir Bu modeller son derece ilginç ve ekipler de çok güçlü, ancak ekonomik mantık göz ardı edilmektedir Geliştirici araçları ve altyapı yazılımı Stratejik yatırımcılar için daha az ilgi çekici, ancak venture yatırımcıları için daha caziptir Bulut dönüşümü döneminde bu katmanda 1 milyar doların üzerinde gelir elde eden yaklaşık 15 şirket ortaya çıktı Yapay zeka dönüşümünde de benzer bir durumun yaşanması bekleniyor Uygulamalar Venture yatırımcıları için en ilgi çekici katmandır Bulut dönüşümü boyunca uygulama katmanında 1 milyar doların üzerinde gelir elde eden yaklaşık 20 şirket ortaya çıktı Mobil dönüşümde de benzer sayıda şirket doğdu ve bu yapay zeka dönüşümünde de benzer bir eğilim bekleniyor Kapanış düşünceleri Üretken yapay zekanın bir sonraki aşamasında muhakeme araştırma ve geliştirmesinin (R&D) etkisinin uygulama katmanına hızlı ve derin şekilde yayılması bekleniyor Mevcut bilişsel mimariler esas olarak “kısıt çözme (unhobbling)” tekniklerini içeriyordu, ancak artık bu yetenekler modelin kendisine gömülüyor; bu da ajan tabanlı uygulamaların daha sofistike ve daha sağlam hale gelmesini sağlayacak Laboratuvarlarda Reasoning ve Inference-Time hesaplaması önemli başlıklar olmaya devam edecek ve artık yeni ölçekleme yasaları ortaya çıktığına göre bir sonraki rekabet başlamış durumda Ancak belirli alanlarda gerçek dünya verisini toplamak ve alan ile uygulamaya özgü bilişsel mimarileri kodlamak hâlâ zor Bu sorunları çözmede son kilometre uygulama sağlayıcıları avantajlı olabilir İleride Factory’nin Droid’i gibi çok ajanlı sistemlerin ortaya çıkıp, muhakeme ve sosyal öğrenme süreçlerini modelleme biçimiyle yaygınlaşması mümkün Çok ajanlı sistemlerin, aynı anda birden fazla işi yürütebilen ekipler oluşturarak daha fazla işi başarması bekleniyor Pek çok kişinin beklediği an, üretken yapay zekanın “Move 37” anı; yani AlphaGo’nun Lee Sedol karşısında gösterdiği gibi genel yapay zeka sistemlerinin beklenmedik, insanüstü davranış sergilediği an Bu anın gelmesi, yapay zekanın “bilinç kazanacağı” anlamına gelmez; ancak yapay zekanın algı, muhakeme ve eylem süreçlerini simüle ederek özgün ve faydalı biçimlerde keşif yapabilme yeteneği kazanabileceği anlamına gelebilir Bu, AGI’nin (yapay zekanın tam özerkliği) kendisi olabilir ve bu da tek seferlik bir olaydan ziyade teknolojinin bir sonraki aşamasına geçiş anlamına gelir

(sequoiacap.com)

30 puan yazan xguru 2024-10-21 | 4 yorum | WhatsApp'ta paylaş

Generative AI devriminin ikinci yılına girilirken, araştırmalar "hızlı düşünme"den "yavaş düşünme"ye evriliyor
- "Hızlı düşünme", önceden eğitilmiş hızlı yanıtları ifade ederken, "yavaş düşünme" inference sırasında reasoning yapılmasını ifade ediyor
- Bu evrim nedeniyle yeni tür ajan uygulamaları ortaya çıkıyor
Generative AI pazarının temel katmanı istikrar kazanırken Microsoft/OpenAI, AWS/Anthropic, Meta, Google/DeepMind gibi az sayıdaki büyük oyuncu pazara yön veriyor
- Yalnızca ekonomik motora ve devasa sermayeye sahip büyük şirketler rekabette kalabiliyor
- Pazar yapısının kendisi sağlamlaşıyor ve ucuz, bol miktarda next-token tahmini mümkün hale gelecek
LLM pazar yapısı istikrar kazanırken yeni bir frontier ortaya çıkıyor
- Odak, "System 2" düşünme biçimini önceleyen reasoning katmanının geliştirilmesi ve ölçeklenmesine kayıyor
- AlphaGo gibi modellerden ilham alan bu katman, basit pattern matching'in ötesine geçerek dikkatli muhakeme, problem çözme ve bilişsel işlevleri yapay zeka sistemlerine kazandırmayı hedefliyor
- Yeni bilişsel mimariler ve kullanıcı arayüzleri, bu reasoning yeteneklerinin kullanıcıya nasıl sunulduğunu ve nasıl etkileşime girdiğini şekillendiriyor

Strawberry Fields Forever

2024'ün en önemli model güncellemesi OpenAI'nin o1'i (önceden Q* olarak biliniyordu, Strawberry olarak da anılıyordu)
- Bu, yalnızca OpenAI'nin model kalite sıralamalarında üst sıralara çıkması değil, aynı zamanda mevcut mimaride kayda değer bir iyileşme sağlaması anlamına geliyor
- Daha somut olarak bu, reasoning-time compute ile elde edilen gerçek bir "genel muhakeme yeteneği"ne sahip ilk model
Ön eğitimli model vs reasoning-time compute
- Ön eğitimli modeller, çok büyük miktarda veri kullanarak next token prediction gerçekleştirir
- Ölçeğin ortaya çıkardığı özelliklerden biri temel düzeyde muhakemedir, ancak bu muhakeme oldukça sınırlıdır
- Reasoning-time compute, modele yanıt vermeden önce durup düşünmesinin istenmesi anlamına gelir
- Bunun için inference sırasında daha fazla compute gerekir
- "Durup düşünme" kısmı tam olarak reasoning'dir

AlphaGo ve LLM karşılaştırması

AlphaGo, 2016 Mart'ında Seul'de baduk efsanesi Lee Sedol ile karşılaşarak derin öğrenme tarihinin en önemli anlarından birini yarattı
- AlphaGo, dünyaya sadece pattern taklit eden değil, "düşünen AI" görünümünü gösterdi
AlphaGo ile önceki oyun oynayan AI sistemleri arasındaki fark
- AlphaGo da LLM'ler gibi yaklaşık 30 milyon önceki oyun hamlesinden oluşan bir veritabanı ve self-play üzerinden insan uzmanları taklit edecek şekilde önceden eğitildi
- Ancak ön eğitimli bir modelden gelen anlık tepkiyi vermek yerine AlphaGo zaman ayırıp duruyor ve düşünüyor
- Inference sırasında AlphaGo, çok sayıda potansiyel gelecek senaryo için search veya simulation çalıştırıyor, bu senaryoları değerlendiriyor ve ardından beklenen değeri en yüksek olan senaryoya (veya yanıta) göre cevap veriyor
- AlphaGo'ya ne kadar çok zaman verilirse performansı o kadar artıyor
- Hiç reasoning-time compute olmadan AlphaGo en iyi insan oyuncuları yenemiyor
Reklam
LLM'lerde AlphaGo'yu kopyalamanın neden zor olduğu
- Yanıtı değerlendiren bir value function oluşturmak zor
- Baduk'ta oyunu sonuna kadar simüle edip kimin kazandığını görebilir, ardından bir sonraki hamlenin beklenen değerini hesaplayabilirsiniz
- Kodlamada kodu test edip çalışıp çalışmadığını görebilirsiniz
- Ancak bir makale taslağı, seyahat planı veya uzun bir belgedeki temel terimlerin özeti gibi çıktıları değerlendirmek zordur
- Bu, mevcut metodolojilerle reasoning'in neden zor olduğunu ve Strawberry'nin mantığa yakın alanlarda (ör. kodlama, matematik, bilim) görece güçlü, açık uçlu ve yapılandırılmamış alanlarda (ör. yazı yazma) ise neden daha zayıf olduğunu açıklar
Strawberry modelinin reasoning yeteneklerini geliştirmeye yönelik araştırmalar
- Strawberry'nin gerçek uygulaması sıkı şekilde korunuyor olsa da, temel fikir modelin ürettiği düşünce zinciri üzerinde yapılan reinforcement learning ile ilgili
- Modelin düşünce zincirini denetlemek, insanın düşünme ve muhakeme biçimine benzer şekilde temel ve ilgi çekici bir şeylerin gerçekleştiğine işaret ediyor
- Örneğin o1, reasoning-time scaling'in ortaya çıkan bir özelliği olarak tıkandığında geri dönebilme yeteneği gösteriyor
- Ayrıca insan gibi problem üzerine düşünebilme (ör. bir geometri problemini çözmek için küre üzerindeki noktaları görselleştirme) ve probleme yeni biçimlerde yaklaşabilme (ör. bir programlama yarışması problemini insanlardan farklı bir şekilde çözme) yeteneği sergiliyor
- Araştırma ekibinin, modelin reasoning yeteneklerini artırmak için ödül fonksiyonu hesaplamaya yönelik yeni yöntemler ve generator/verifier açığını kapatmaya yönelik yeni yaklaşımlar dahil olmak üzere reasoning-time compute'u ilerletecek pek çok fikri bulunuyor
- Kısacası, derin reinforcement learning yeniden ilgi odağına giriyor ve bu da genel olarak yeni bir reasoning katmanını mümkün kılıyor

System 1'den System 2 Thinking'e sıçrayış

Önceden eğitilmiş içgüdüsel tepkilerden ("System 1") daha derin ve dikkatli muhakemeye ("System 2") geçiş, yapay zekada bir sonraki frontier olarak öne çıkıyor
Modelin sadece bir şeyi biliyor olması yeterli değil
Modelin gerçek zamanlı kararlar vermek için durması, değerlendirmesi ve muhakeme yürütmesi gerekiyor
Ön eğitim, System 1 katmanına karşılık gelir
- İster AlphaGo'da milyonlarca baduk hamlesi öğrenilsin ister LLM'lerde internet ölçeğinde petabaytlarca metin öğrenilsin, ön eğitimin amacı insan oyununu ya da dili gibi kalıpları taklit etmektir
- Ancak taklit, ne kadar güçlü olursa olsun, gerçek muhakeme değildir
- Özellikle eğitim veri kümesinin dışındaki karmaşık ve yeni durumlarda düzgün şekilde düşünemez
System 2 düşünme, güncel AI araştırmalarının odak noktası
- Model "durup düşündüğünde", yalnızca öğrenilmiş kalıpları üretmiyor veya geçmiş verilere dayalı tahminleri dışa vurmuyor
- Olasılık aralığı üretiyor, potansiyel sonuçları değerlendiriyor ve muhakemeye dayalı kararlar veriyor
System 1 düşünme ile System 2 düşünmenin uygun kullanımı
- Birçok görevde System 1 düşünme yeterlidir (ör. Bhutan'ın başkentinin ne olduğu konusunda daha uzun düşünmek yardımcı olmaz)
- Ancak matematikte ya da biyolojide bir atılım gibi daha karmaşık problemlerde hızlı ve içgüdüsel tepkiler yetersiz kalır
- Bu tür ilerlemeler derin düşünme, yaratıcı problem çözme ve her şeyden önemlisi zaman gerektirir
- AI için de durum aynıdır. En zor ve en anlamlı problemleri çözmek için, hızlı öğrenilmiş veri kümesi içi tepkilerin ötesine geçip insan ilerlemesini tanımlayan o düşünceli muhakemeyi üretmek üzere zaman ayırması gerekir

Yeni ölçekleme yasası: reasoning rekabetinin başlangıcı

OpenAI'nin o1 makalesindeki en önemli içgörü, yeni bir ölçekleme yasasının ortaya çıkmış olması
LLM ön eğitiminin ölçekleme yasası
- LLM ön eğitimi iyi anlaşılmış bir ölçekleme yasasını takip eder
- Modelin ön eğitimi için ne kadar fazla compute ve veri kullanılırsa performans o kadar yükselir
Reklam
Reasoning-time compute için yeni ölçekleme yasası
- o1 makalesi, compute ölçeklendirmesi için yeni bir boyut açtı
- Modele ne kadar fazla reasoning-time (veya "test time") compute verilirse muhakeme yeteneği o kadar gelişir
Modelin saatlerce, günlerce, onlarca yıl düşünebildiğini varsaysak ne olur?
- Riemann hipotezini çözebilir mi?
- Asimov'un son sorusuna yanıt verebilir mi?
Büyük ölçekli ön eğitim kümelerinden reasoning cloud'a geçiş
- Bu değişim bizi büyük ölçekli ön eğitim cluster'ları dünyasından reasoning cloud'a taşıyacak
- Reasoning cloud, görevin karmaşıklığına göre compute'u dinamik biçimde ölçekleyebilen bir ortamdır

Tek bir model her şeye hakim olacak mı?

OpenAI, Anthropic, Google ve Meta gibi şirketler muhakeme katmanını genişletip daha güçlü muhakeme makineleri geliştirdikçe ne olacak?
Tek bir model her şeye hakim olacak mı?
Bir hipotez, tek bir model şirketinin aşırı güçlü hale gelerek diğer tüm uygulamaları içine çekeceği yönündeydi
- Bu öngörünün şimdiye kadar iki açıdan yanlış olduğu ortaya çıktı
- Birincisi, model katmanında SOTA yetenekleri için sürekli yarışan çok sayıda rakip var
  - Birinin geniş alanlı self-learning yoluyla sürekli kendini geliştirmeyi başarıp sıçrama yapması mümkün, ancak henüz buna dair bir kanıt yok
  - Aksine, model katmanı kıyasıya rekabetin yaşandığı bir alan ve GPT-4'ün token başına fiyatı geçen Developer Day'den bu yana %98 düştü
- İkincisi, modeller uygulama katmanına ilerlemekte zorlanıyor
  - ChatGPT dışında, modeller uygulama katmanında çığır açan ürünler haline gelmekte genel olarak başarısız oldu
  - Çünkü gerçek dünya karmaşıktır
  - Harika araştırmacılar, mümkün olan her dikey pazardaki her olası özelliğin ayrıntılı uçtan uca iş akışlarını anlamak istemez
  - Araştırmacıların API seviyesinde durup gerçek dünyanın karmaşıklığını geliştirici ekosistemine bırakması hem cazip hem de ekonomik olarak mantıklı
  - Bu, uygulama katmanı için iyi haber

Karmaşık gerçek dünya: özelleştirilmiş bilişsel mimariye duyulan ihtiyaç

Bir bilim insanı olarak hedeflere ulaşmak için eylemleri planlama ve yürütme biçimi ile bir yazılım mühendisi olarak çalışma biçimi büyük ölçüde farklıdır
Ayrıca farklı şirketlerde yazılım mühendisi olarak çalışma biçimleri de birbirinden farklıdır
Laboratuvarlarda yatay genel amaçlı muhakemenin sınırları daha da zorlanıyor, ancak yararlı AI ajanları sunmak için hâlâ uygulamaya veya alana özgü muhakemeye ihtiyaç var
Karmaşık gerçek dünya, genel modellere verimli biçimde kodlanamayan önemli ölçüde alan ve uygulama özelinde muhakeme gerektirir
Bilişsel mimarinin ortaya çıkışı
- Bilişsel mimari, sistemin düşünme biçimini, yani kullanıcı girdisini alıp eylem gerçekleştiren veya yanıt üreten kod ve model etkileşimlerinin akışını ifade eder
- Örneğin Factory'de her bir "droid" ürünü, pull request incelemesi ya da backend servisler arası güncellemeler için migration planı yazıp uygulamak gibi belirli görevleri çözmek amacıyla insanların düşünme biçimini taklit eden özelleştirilmiş bir bilişsel mimariye sahiptir
- Factory droid'leri tüm bağımlılıkları analiz eder, ilgili kod değişiklikleri önerir, unit test'ler ekler ve inceleme için bir insanı sürece dahil eder
- Ardından onaydan sonra geliştirme ortamındaki tüm dosyalarda değişiklikleri uygular, tüm testler geçerse kodu merge eder
- Bu, genelleştirilmiş ve kara kutu gibi tek bir yanıttan ziyade, bir dizi ayrı görevden oluşan insan düşünme biçimine benzer
Reklam

App tarafında neler oluyor?

Bir AI işi kurmak için hangi katman hedeflenmeli?
- Altyapı katmanında rekabet etmek için NVIDIA ve hyperscaler'ları yenmek gerekir
- Model katmanında rekabet etmek için OpenAI ve Mark Zuckerberg'i yenmek gerekir
- Uygulama katmanında rekabet etmek için kurumsal BT'yi ve küresel sistem entegratörlerini yenmek gerekir
- Uygulama katmanındaki rekabet en uygulanabilir olan gibi görünüyor
Uygulama katmanındaki fırsat
- Temel modeller sihir gibi görünse de karmaşıktır
- Ana akım işletmeler kara kutularla, halüsinasyonlarla ve hantallık gösteren iş akışlarıyla başa çıkamaz
- Tüketiciler boş bir prompt gördüğünde ne istemeleri gerektiğini bilmez
- Bu, uygulama katmanının fırsatıdır
İki yıl önce birçok uygulama katmanı şirketi, "GPT-3 üzerine kurulmuş bir wrapper'dan ibaret" diye eleştiriliyordu
- Bugün bu wrapper'lar, sürdürülebilir değer inşa etmenin az sayıdaki sağlıklı yolundan biri olarak ortaya çıktı
- "Wrapper" diye başlayan şey, "bilişsel mimari"ye evrildi
Uygulama katmanındaki AI şirketlerinin özellikleri
- Sadece temel modelin üstüne bir UI koymaktan ibaret değildir
- Genellikle şunları içeren sofistike bir bilişsel mimariye sahiptirler:
  - Üstte bir tür routing mekanizması bulunan birden fazla temel model
  - RAG için vektör ve/veya graph veritabanları
  - Uyumluluğu sağlamak için guardrail'ler
  - İş akışları üzerinden muhakeme biçimini taklit eden uygulama mantığı

Service-as-a-Software

Buluta geçiş, "Software-as-a-Service" idi. Yazılım şirketleri bulut hizmet sağlayıcılarına dönüştü ve bu 350 milyar dolarlık bir fırsattı
Ajan muhakemesi sayesinde AI dönüşümü, "Service-as-a-Software" haline geliyor. Yazılım şirketleri emeği yazılıma dönüştürüyor
Bu, hedef pazarın yazılım pazarı değil, trilyonlarca dolarlık hizmet pazarı olduğu anlamına geliyor
İş satmanın anlamı
- Sierra adlı şirket buna iyi bir örnek
- B2C şirketleri müşterileriyle konuşmak için Sierra'yı kendi web sitelerine yerleştiriyor
- Yapılması gereken iş (job-to-be-done), müşteri sorunlarını çözmektir
- Sierra, çözülen sorun başına ücret alır
- "Seat" diye bir şey yoktur. Ortada yapılması gereken bir iş vardır, Sierra o işi üstlenir ve buna göre ücret alır
- Bu, birçok AI şirketi için gerçek kuzey yıldızıdır
Sierra'nın avantajı ve diğer şirketlerin zorlukları
- Sierra'nın zarif bir başarısızlık modunun avantajı vardır: insan müşteri temsilcisine escalation
- Her şirket bu kadar şanslı değil
- Yeni kalıp, önce pilot olarak human-in-the-loop ile devreye almak, ardından bu deneyimden yararlanarak autopilot yani human-out-of-the-loop dağıtımı için fırsat bulmaktır
- GitHub Copilot buna iyi bir örnektir
Reklam

Yeni tür ajan uygulamaları ortaya çıkmaya başladı

Generative AI'nin yeni muhakeme yetenekleriyle birlikte yeni tür ajan uygulamaları ortaya çıkmaya başladı
İlginç biçimde, bu uygulama katmanı şirketleri önceki bulut şirketlerinden farklı görünüyor:
- Bulut şirketleri yazılım gelirini hedeflerken, AI şirketleri hizmet gelirini hedefliyor
- Bulut şirketleri yazılım ($/seat) satarken, AI şirketleri iş ($/sonuç) satıyor
- Bulut şirketleri sürtünmesiz dağıtımla bottom-up yaklaşımını tercih ederken, AI şirketleri giderek daha fazla high-touch, high-trust teslim modeliyle top-down yaklaşıma yöneliyor
Bilgi ekonomisinin tüm sektörlerinde ortaya çıkan ajan uygulamalarına örnekler
- Harvey: AI avukatı
- Glean: AI iş asistanı
- Factory: AI yazılım mühendisi
- Abridge: AI tıbbi kayıt uzmanı
- XBOW: AI penetration tester
- Sierra: AI müşteri destek ajanı
Bu hizmetleri sunmanın marjinal maliyeti, muhakeme maliyetlerindeki sert düşüşle aynı seviyelere indirilerek ajan uygulamaları yeni pazarları genişletiyor ve yaratıyor
XBOW buna iyi bir örnek:
- XBOW, AI "pentester" geliştiriyor
- "Pentest" ya da penetration testing, şirketlerin kendi güvenlik sistemlerini değerlendirmek için gerçekleştirdiği, bilgisayar sistemlerine yönelik simüle edilmiş bir siber saldırıdır
- Generative AI'den önce insan eliyle yapılan pentest pahalı olduğu için (vasıflı personelin yaptığı manuel bir iş), şirketler yalnızca sınırlı durumlarda, örneğin mevzuat uyumluluğu gerektiğinde pentester işe alıyordu
- Ancak XBOW artık en güncel muhakeme LLM'lerine dayanan otomatik pentest gösterimleri yapıyor ve bu, en yetenekli insan pentester'ların performansına rakip oluyor
- Bu da pentest pazarını büyütüyor ve her ölçekten ve her yapıdaki şirket için sürekli pentest olanağının önünü açıyor

Bunun SaaS sektörüne etkisi ne?

Bu yılın başında LP’lerle görüştüğümüzde en sık aldığımız soru, “Yapay zeka dönüşümü mevcut bulut şirketlerini yıkacak mı?” oldu
Biz güçlü bir başlangıç varsayımı olarak “hayır” ile yola çıktık
- Startup’larla yerleşik şirketler arasındaki klasik mücadele, startup’ların dağıtım kurup yerleşik şirketlerin ürün geliştirdiği bir yarışa benzer
- Müşteriye sahip olan yerleşik şirketler harika bir ürün çıkarmadan önce, harika ürüne sahip genç şirketler müşteriye ulaşabilir mi?
- Yapay zekanın büyüsünün büyük ölçüde foundation model’lerden geldiği düşünüldüğünde, temel varsayımımız “hayır”dı
- Yerleşik şirketler de startup’lar kadar foundation model’lere erişebiliyor ve veri ile dağıtım tarafındaki mevcut avantajlara sahip oldukları için başarılı olacaklardır
- Startup’lar için asıl fırsat, mevcut yazılım şirketlerini yerinden etmekten çok otomasyona uygun iş havuzlarını hedeflemektir
Ancak artık bundan o kadar emin değiliz
- Yukarıda bilişsel mimari hakkında söylenenlere bakın
- Modelin ham yeteneklerini ikna edici ve güvenilir uçtan uca iş çözümlerine dönüştürmek için muazzam miktarda mühendislik gerekiyor
- “AI native” olmanın ne anlama geldiğini dramatik biçimde hafife alıyor olabilir miyiz?
20 yıl önce on-premise yazılım şirketleri SaaS fikrine burun kıvırıyordu
- “Önemsiz. Kendi sunucularımızı da işletip bunu internet üzerinden sunabiliriz!”
- Kavramsal olarak basitti, ancak ardından işin baştan sona yeniden icadı geldi:
  - EPD, waterfall model ve PRD’den agile geliştirme ve AB testing’e geçti
  - GTM, tepeden inme kurumsal satış ve biftekli akşam yemeklerinden aşağıdan yukarıya PLG ve ürün analitiğine geçti
  - İş modeli, yüksek ASP ve bakım gelir akışlarından yüksek NDR ve kullanıma dayalı fiyatlamaya geçti
  Reklam
- On-premise şirketlerden çok azı bu dönüşümü başarıyla gerçekleştirebildi
Yapay zeka, SaaS’a benzer bir dönüm noktası olabilir mi? Yapay zekadaki fırsat, hem işi satarken aynı anda yazılımın yerini almak olabilir mi?
Day.ai üzerinden geleceğe kısa bir bakış atabildik
- Day, AI native bir CRM’dir
- Sistem entegratörleri, Salesforce’u müşterilerin ihtiyaçlarına göre yapılandırarak milyarlarca dolar kazanıyor
- Day ise yalnızca e-posta ve takvime erişim ile tek sayfalık bir anketin yanıtlarından hareketle, müşterinin işine mükemmel uyum sağlayan bir CRM’i otomatik olarak oluşturuyor
- Henüz tüm özelliklere sahip değil, ancak insan müdahalesi olmadan sürekli güncel kalan otomatik oluşturulmuş CRM’in büyüsü şimdiden insanları geçiş yapmaya ikna ediyor

Yatırım sektörü

Yatırımcılar zamanlarını ve sermayelerini nereye ayırıyor?
Altyapı
- Bu alan hyperscaler’ların sahasıdır
- Ekonomik analizden çok oyun teorisine dayalı davranışlarla yönlendirilmektedir
- Venture yatırımcıları için uygun bir alan değildir
Model
- Hyperscaler’ların ve finansal yatırımcıların (FI) faaliyet gösterdiği alandır
- Hyperscaler’lar, varlık bilançolarını kullanarak getiri elde etmek ve bunun bulut işinde hesaplama maliyeti olarak geri dönmesi mantığıyla yatırım yapar
- Finansal yatırımcılar ise “bilime hayran olma” yanlılığından etkilenir
- Bu modeller son derece ilginç ve ekipler de çok güçlü, ancak ekonomik mantık göz ardı edilmektedir
Geliştirici araçları ve altyapı yazılımı
- Stratejik yatırımcılar için daha az ilgi çekici, ancak venture yatırımcıları için daha caziptir
- Bulut dönüşümü döneminde bu katmanda 1 milyar doların üzerinde gelir elde eden yaklaşık 15 şirket ortaya çıktı
- Yapay zeka dönüşümünde de benzer bir durumun yaşanması bekleniyor
Uygulamalar
- Venture yatırımcıları için en ilgi çekici katmandır
- Bulut dönüşümü boyunca uygulama katmanında 1 milyar doların üzerinde gelir elde eden yaklaşık 20 şirket ortaya çıktı
- Mobil dönüşümde de benzer sayıda şirket doğdu ve bu yapay zeka dönüşümünde de benzer bir eğilim bekleniyor

Kapanış düşünceleri

Üretken yapay zekanın bir sonraki aşamasında muhakeme araştırma ve geliştirmesinin (R&D) etkisinin uygulama katmanına hızlı ve derin şekilde yayılması bekleniyor
Mevcut bilişsel mimariler esas olarak “kısıt çözme (unhobbling)” tekniklerini içeriyordu, ancak artık bu yetenekler modelin kendisine gömülüyor; bu da ajan tabanlı uygulamaların daha sofistike ve daha sağlam hale gelmesini sağlayacak
Laboratuvarlarda Reasoning ve Inference-Time hesaplaması önemli başlıklar olmaya devam edecek ve artık yeni ölçekleme yasaları ortaya çıktığına göre bir sonraki rekabet başlamış durumda
Ancak belirli alanlarda gerçek dünya verisini toplamak ve alan ile uygulamaya özgü bilişsel mimarileri kodlamak hâlâ zor
Bu sorunları çözmede son kilometre uygulama sağlayıcıları avantajlı olabilir
İleride Factory’nin Droid’i gibi çok ajanlı sistemlerin ortaya çıkıp, muhakeme ve sosyal öğrenme süreçlerini modelleme biçimiyle yaygınlaşması mümkün
Çok ajanlı sistemlerin, aynı anda birden fazla işi yürütebilen ekipler oluşturarak daha fazla işi başarması bekleniyor
Pek çok kişinin beklediği an, üretken yapay zekanın “Move 37” anı; yani AlphaGo’nun Lee Sedol karşısında gösterdiği gibi genel yapay zeka sistemlerinin beklenmedik, insanüstü davranış sergilediği an
Bu anın gelmesi, yapay zekanın “bilinç kazanacağı” anlamına gelmez; ancak yapay zekanın algı, muhakeme ve eylem süreçlerini simüle ederek özgün ve faydalı biçimlerde keşif yapabilme yeteneği kazanabileceği anlamına gelebilir
Bu, AGI’nin (yapay zekanın tam özerkliği) kendisi olabilir ve bu da tek seferlik bir olaydan ziyade teknolojinin bir sonraki aşamasına geçiş anlamına gelir

4 yorum

lsw4uto 2024-11-11

Gittikçe daha akıllı hale gelen yapay zekayla hangi sorunların çözülebileceğini görmek heyecan verici.

aer0700 2024-10-27

Model uzun süre düşünüp Riemann hipotezini çözebilirse, etkisi muazzam olur.

pmc7777 2024-10-21

Model katmanında rekabet etmek istiyorsan OpenAI ve Mark Zuckerberg'i yenmen gerekiyor

Meta değil de Zuckerberg'den bahsetmeleri nedense komik geldi hahaha

kotzen 2024-10-21

Özet yazıda açıkça belirtilmemiş, belki gerek olur diye ekleyeyim: Sistem 1 ve Sistem 2, Thinking, Fast and Slow adlı kitapta geçen kavramlardır.
Sistem 1: Derinlemesine düşünmeden bilinçsizce ya da sezgisel olarak hareket eden hızlı düşünme; örn. araba sürmek, yürümek
Sistem 2: Mantıksal olarak yoğun şekilde düşünmeyi gerektiren yavaş düşünme; örn. zihinden hesap yapmak