1 puan yazan GN⁺ 8 일 전 | 1 yorum | WhatsApp'ta paylaş
  • Amazon'un ek yatırımıyla birlikte önümüzdeki 10 yılda AWS'de 100 milyar doların üzerinde harcama yapılması konusunda anlaşmaya varıldı; bulut altyapısı ve finansmanın birleştiği bir işlem yapısı ortaya çıktı
  • Bunun karşılığında Claude'un eğitimi ve işletimi için kullanılacak yeni bilgi işlem kapasitesi olarak en fazla 5 GW güvence altına alındı; yalnızca nakit yatırımın ötesinde, fiili altyapı kullanım hakkı da temel unsur olarak yer aldı
  • Amazon'un toplam yatırım tutarı 13 milyar dolara yükseldi ve bu yapı, iki ay önce yapılan OpenAI yatırım anlaşmasına benzer bir form taşıyor
  • Anlaşmanın merkezinde Amazon'un özel çipleri yer alıyor; Graviton ve Trainium ailesi içinde Trainium2'den Trainium4'e kadar kapsam dahilinde
  • Gelecekte çıkacak çipler için de kapasite satın alma opsiyonu güvence altına alındı; bu açıklama, Anthropic'in ek fon toplama ihtimali ve 800 milyar doların üzerindeki şirket değerlemesi haberleriyle devam etti

Anlaşmanın genel görünümü

  • Amazon'un ek 5 milyar dolarlık yatırımı konusunda anlaşma sağlandı; böylece Anthropic'e yönelik Amazon'un toplam yatırımı 13 milyar dolara çıktı
  • Anthropic'in AWS harcama taahhüdü de anlaşmaya dahil edildi; önümüzdeki 10 yıl boyunca AWS'de 100 milyar doların üzerinde harcama yapılması kabul edildi
    • Bunun karşılığında Claude'un eğitimi ve işletimi için kullanılacak yeni bilgi işlem kapasitesi olarak en fazla 5 GW sağlandı
  • Bu anlaşma, Amazon'un yakın zamanda yaptığı başka bir yapay zeka yatırımının yapısına benziyor
    • Sadece doğrudan nakit yatırım değil, bulut altyapı hizmetleri de işlem yapısının bir parçası olarak dahil edildi

OpenAI anlaşmasıyla karşılaştırma

  • İki ay önce Amazon'un OpenAI ile yaptığı anlaşmayla yapısal benzerlikler bulunuyor
    • Amazon, 110 milyar dolarlık fonlama turuna katıldı
    • Bunun 50 milyar dolarını kendisi koydu
    • Bu turda ChatGPT geliştiricisinin pre-money değerlemesi 730 milyar dolar olarak kaydedildi
  • OpenAI anlaşması da doğrudan nakdin yanı sıra altyapı sağlanmasını kısmen içeren bir yapıdaydı

Temel altyapı ve çipler

  • Bu anlaşmanın merkezinde Amazon'un özel çipleri bulunuyor
    • Graviton, düşük güç tüketimli CPU
    • Trainium ise Nvidia ile rekabet eden bir yapay zeka hızlandırıcı çipi
  • Anthropic anlaşmasının kapsamına Trainium2'den Trainium4'e kadar olan seri dahil
    • Trainium4 şu anda kullanıma açık değil
    • En yeni çip olan Trainium3 aralık ayında çıkıyor
  • Anthropic, gelecekte çıkacak Amazon çipleri için de kapasite satın alma opsiyonu elde etti
    • Yeni çipler sunulduğunda, ilgili kapasiteyi satın alma hakkını içeren bir seçenek bulunuyor

Ek fon toplama ihtimali

  • Bu açıklamanın, Anthropic'in yeni bir fonlama turunun habercisi olabileceği belirtiliyor
  • Girişim sermayesi şirketlerinin Anthropic'e sermaye koymayı teklif ettiğine dair haberler var
    • Söz konusu anlaşmaya göre şirket değerlemesinin 800 milyar doların üzerinde olabileceğine ilişkin haberlere atıf yapılıyor

1 yorum

 
GN⁺ 8 일 전
Hacker News görüşleri
  • Şu anki duruma bakınca kârlılık yanılsamasının neredeyse sonuna gelindiği hissi var. Yatırımcı beklentileri kadar gelir üretilip üretilmediği şüpheli ve Anthropic ile OpenAI'nin IPO hamleleri de zaman kazanma tercihi gibi görünüyor. Tokenların gerçek maliyeti ortaya çıkmaya başladı ve compute darboğazı da ciddi. Opus 4.7'nin 7,5 kat token tarifesini görünce yük daha da ağırlaştı; açık modeller çok daha ucuz olduğu için şirketler maliyete duyarlı hale geldikçe büyük iki oyuncunun daha kırılgan olacağını düşünüyorum. Veri merkezi ve elektrik arzı yeterince hızlı artacak mı, yoksa bu AGI'ye önce ulaşmak için devasa bir all-in mi, merak ediyorum. Her şeyden önemlisi model performansı duraklamış gibi ve karmaşık işlerde hatta verimliliğin düştüğünü hissediyorum
    • Bence birçok şirketin en başta halka açık piyasada olmasına gerek yoktu. Çeyreklik sonuçlar kötü gelince kanamayı durdurma sinyali vermek için sürekli toplu işten çıkarma yapılması çok zararlı ve gülünç geliyor. Çalıştığım şirketlerde de en iyi dönemler halka açık değilken yaşandı; sonunda ekonomik duvarlara çarpıp daha büyük halka açık şirketlere satıldılar. Yalnızca uzun vadeli yatırım yapılabilen ve paranın birkaç yıl çekilemediği alternatif piyasalar olsa daha sağlıklı olurdu diye düşünüyorum
    • Yazılım geliştirme açısından bakınca mevcut modellerin token başı maliyeti yeterince haklı çıkardığını düşünüyorum. Bu hamle bana zorlama bir sinyalden çok, talebi öngörüp arzı önceden güvenceye alma kararı gibi geliyor. Gelecekteki yakıtını önceden alan bir havayolu ya da Apple'ın DRAM arzını kapması gibi bir tablo olarak okuyorum
    • Bu karamsarlığın gerçeğe ne kadar değdiğinden emin değilim. Fortune 500 şirketleri artık Anthropic gibi firmalarla deney yapan aşamayı geçti; şimdi organizasyon geneline nasıl yayacaklarını ve yönetişimi nasıl kuracaklarını aceleyle netleştiriyorlar. Abartı olduğu doğru ama değer önerisi giderek daha somut hale geliyor hissi var. Bazı yapay zeka şirketleri harcamayı fazla abartılı taahhüt etmiş olabilir ama Anthropic'in nispeten hızlı biçimde kârlılığa yaklaştığını düşünüyordum
    • Tamamen karşı değilim ama birkaç itirazım var. Öncelikle model sağlayıcılarının yalnızca çıkarım token hizmet maliyetine bakıldığında şimdiden kârlı olduğu argümanı ikna edici. Zarar daha çok yeni nesil model eğitiminden kaynaklanıyor gibi görünüyor. Açık modellerde performans farkı hâlâ büyük; tokenlar şimdilik nispeten ucuz, halüsinasyon maliyeti ise pahalı olduğundan, coding agent tarafında açık model kullanımının büyük ölçüde arttığını hissetmedim. Yapay zeka ekonomisinin geneline ben de tam emin değilim ama Meta ve Microsoft gibi şirketlerin değerlemeleri zaten bir miktar geriledi ve yatırımcılar da aşırı değerlemeye karşı belli ölçüde temkinli görünüyor. Uyarı işaretleri çok net değil ama şirket kârları hâlâ sağlıklı duruyor. Anthropic token maliyeti analizi ve şirket kârlarıyla ilgili Economist yazısı'na bakmıştım
    • Ben de yönün bu olduğunu hissediyorum. Gerçekten de servisler kullanım limitlerini sıkmaya başlamış gibi görünüyor. Google 5TB planı sayesinde Gemini Pro kullanıyorum, IDE tarafında da Github Copilot Pro var; son zamanlarda Gemini limite çok daha hızlı çarpıyor ve birkaç saat içinde Pro tokenlarını tükettiğime dair mesaj görüyorum. Eskiden günün büyük bölümünde kullanabiliyordum, şimdi sabah saatlerinde bile takılıyor. Bu yüzden yıl bitmeden büyük GPU'lu bir PC alıp yerelde çalıştırmaya geçmeyi ciddi ciddi düşünüyorum. Şu gidişatta maliyetlerin düşmesinden çok ciddi biçimde artması daha olası görünüyor
  • Eğer 100 milyar dolar harcamak zorundaysan, üçüncü taraf bulut kullanmaya devam etmek mantıklı mı emin değilim. Amazon ne kadar iyi şartlar sunarsa sunsun, böyle bir ölçekte sonunda kendi stack'ine sahip olmak isteyeceğini düşünürüm. Özellikle rekabetin bu kadar sert olduğu bir alanda yakında marjlar önem kazandıkça bu daha da belirgin olur. Şu an hyperscaler'ların aşırı pembe beklentilerle mümkün olan en fazla sermayeyi toplamaya çalıştığı hissi var; bu döngünün zirvesi yakında olabilir, hatta çoktan gelmiş de olabilir
    • Sorun şu ki alternatifin son tahlilde kendi veri merkezlerini kurmak olması. ABD'de 2, Avrupa'da 2, Asya'da 2, Afrika'da 1, LATAM'da 1 gibi bir dağılım gerekebilir ve bunların yarıdan fazlasının zamanında hazır olması gerekir. Ama o "zamanında" kısmı zaten başlı başına zor. Yerel yönetim izinleri, elektrik şirketiyle pazarlıklar, siyasi değişkenler, askeri sözleşmeler gibi nedenlerle izinler iptal olabilir. Üstelik CPU, GPU, bellek ve ağ ekipmanı tedarikinin tamamı da gerekiyor ve endüstriyel güç transformatörlerinde teslim süresinin 5 yılı aşması da büyük mesele. Su arıtma tesisleri de izin olmadan ilerleyemiyor. Böyle bir ortamda AWS ya da Google'ın ayrılma emaresi gördüğü müşterilere özel ayrıcalık sunmasını da beklemezsin. AI ve LLM zaten karmaşık ve kırılgan bir rekabet ortamı; buna bir de veri merkezi inşasını eklemek çeşitlendirme değil, adeta ölüm fermanı gibi geliyor
    • Veri merkezi kurma konusunda hiçbir deneyimi olmayan bir şirketin doğrudan 100 milyar dolarlık compute ölçeğinde çalışan bir kuruma dönüşmesi on yıllara yayılan, yüksek riskli bir hedef gibi görünüyor
    • Bu tür taahhütleri riskin bir kısmını Amazon ya da Oracle gibi altyapı sağlayıcılarına devretme yapısı olarak görüyorum. Anthropic ya da OpenAI tahminleri tutturamasa bile altyapı sağlayıcıları o varlıkları başka müşterilere satabilir ya da kendileri kullanabilir. Tersi durumda, talep beklenenden büyük çıkarsa VC parası daha da akıp rakipleri daha pahalıya da olsa geride bırakabilir. Kendi başına kurup talep tahminini yanlış yapmak çok daha pahalı bir hata olurdu; sonuçta bu bana risk paylaşımı gibi geliyor
    • Bence yanıt zaten haberde var. Anthropic anlaşması henüz piyasaya çıkmamış Trainium4'ü de kapsıyor ve sonrasında Amazon'un çıkacak çip nesillerinde de o kapasiteyi alma opsiyonunu güvenceye alıyor. Yani yalnızca bugünü değil, gelecekteki tüm çip yol haritası boyunca tedarik hakkını önceden kapatma niteliği taşıyor gibi okunuyor
    • Zamanında Facebook'ta, üst düzey AI şirketleri arasında paranın birkaç firma etrafında dönüp durduğunu gösteren bir grafik görmüştüm; gerçekten sarsıcıydı. Neredeyse para çevirme gibi duruyordu ve dolandırıcılığa yakın bir izlenim veriyordu
  • AI laboratuvarlarına dair beklentinin tam olarak ne olduğunu merak ediyorum. Benim gözüme bu ürünler şimdiden neredeyse metalaşmış görünüyor ve güçlü açık kaynak rakipler de bolca var. Sonunda bu modellere biçilen primi haklı çıkarmak giderek zorlaşacak gibi duruyor
    • Sözde Mythos durumunun gerçek ya da abartılı olmasından bağımsız olarak, bunun oyunun sonunu işaret ettiğini hissediyorum. Dünya üzerinde büyük etki yaratacak kadar güçlü modeller ortaya çıkarsa, artık tüketiciye satılacak bir ürün düşünmek yerine kendi başına ekonomiyi ele geçirmede kullanılmasından ya da devlet tarafından kamulaştırılmasından endişe ederiz. Her şeyi otomatikleştirebilen bir makine varsa, neden erişimini satasın ki fikri
    • Açık kaynak modellerin 1-2 yıl içinde tamamen yetişme ihtimalinin yüksek olduğunu düşünüyorum. Ürün de meta, model de meta. Şu anda darboğaz, büyük ölçekli çıkarım için GPU çekirdeği bulmanın zor olması. Sonunda gereken şey kilitlenme yaratabilen bir platform olacak ama bunun neden açık kaynak model temelli olmaması gerektiğini pek anlamıyorum
    • Şu anda büyük teknoloji şirketlerinin çoğunda coding agent'ların geniş ölçekte devreye alındığını düşünüyorum. Bazı yerlerde token limiti neredeyse yok; yeter ki elde edilen faydayı açıklayabil. Şirketler bu araçları iş akışlarına gömüyor ve iç süreçleri de belirli araçlar etrafında belgelemeye başlıyor. Bir yerde işlemeye başladı mı hızla tüm organizasyona kopyalanıyor. Anthropic 30 milyar dolar gelire ulaştıysa ve bu da coding'in geniş ölçekte yayılmasının daha başıysa, bu rakamları görmezden gelmek zor geliyor
    • Bu modellerin bir yandan meta, bir yandan da siber silah olduğunu düşünüyorum. Askeri rekabet içindeki ülkeler, daha iyi AI sayesinde daha güçlü siber ve istihbarat kapasitesine ulaşmak isteyecektir; bu yüzden tek bir laboratuvarı seçmek yerine birden fazla AI savunma şirketini rekabet içinde tutmak isteyebilirler. Geçmişte ABD'nin silahları birçok ülkeye satması gibi, gelecekte Çin, ABD, Fransa gibi ülkelerin AI siber kapasitesi satması mümkün görünüyor. Ülkeler güvenlik nedeniyle başkasının bulutuna tamamen güvenmeyeceği için, tercih ettikleri vendor kümelerini çalıştırabilecek kendi veri merkezlerine de ihtiyaç duyabilirler
    • Hiçbir şirketin gerçek bir hendek sahibi olduğunu düşünmüyorum. OpenAI'nin zaten liderliği kaybettiğini hissediyorum ve şu anda kimsenin net biçimde kazanmadığı ortada. Sonunda bu, ömrü çok da uzun olmayacak GPU'ları yakarak oynanan bir tavuk oyunu gibi görünüyor. Bu arada ilgili karşılaştırma görseline bakmıştım
  • Tüketici sınıfı yerel modeller birkaç yıl içinde yeterince iyi hale gelmeden önce para toplama temposunun daha da hızlandığı hissi var. Şu anda talep patlıyor ama on-device çıkarım yerleşince bir noktada talep sert biçimde düşebilir; bu yüzden bütün yapı bana bir iskambil kulesi gibi görünüyor
    • Ben o geleceği bir ölçüde şimdiden yaşıyorum gibi hissediyorum. İyi bir çalıştırma framework'ü, context yönetimi, unix tabanlı hafıza, web arama ve erişim mekanizmaları eklendiğinde yerel modelleri de en ön cephedeki modellerle neredeyse aynı seviyede kullanabiliyorsun. Hatta bazen hız daha bile iyi oluyor. AI şirketleri hâlâ gerçekte olması gerekenden daha fazla sübvansiyonlu fiyatlama yapıp önde giderken ben de ücret ödemeye devam ederim ama sonunda kendi çöküşlerini yine kendi servisleri üzerinden bootstrap etmelerinin mümkün olduğunu düşünüyorum. Kendi bilgisayarımda kendi yazılımımı çalıştırma tarafını uzun zamandır destekliyorum
    • Ben de o anı bekliyorum. Belki taalas gibi yüksek performanslı özel donanım coding LLM motorlarıyla açık kaynak coding agent kombinasyonu çözüm olabilir. Fiyatı üst seviye bir ekran kartı civarında olursa zaman içinde rahatlıkla kendini amorti edebilir. Bu bana eski IBM mainframe'lerinden PC'lere geçişin yeniden yaşanması gibi geliyor
    • Tüketiciye yönelik modeller zaten epey iyi ve yerel çıkarımdaki asıl darboğazın donanım olduğunu düşünüyorum. Küçük modeller neredeyse her cihazda çalışabilir ama daha fazla bilgi ve daha büyük context istedikçe gereksinimler hızla artıyor
  • Bunun Nvidia ile OpenAI arasında görülen yapıya benzer şekilde, sonunda para ve borcun döngüsüne yakın bir şey olup olmadığını merak etmiştim
    • Nvidia ile OpenAI örneğinde gerçekten ekran kartları el değiştirmişti ve vendor financing zaten otomobil bayisinin krediyle araba satmasına benzer biçimde yaygın bir yöntem diye düşünüyorum
    • Oracle'ın da buna girip sonradan darbe aldığını hatırlıyorum
    • Çip geliştirmede ön safa çıkmak için sonuçta ölçek ekonomisi gerekiyor. Bu yüzden talebi finansmanla destekleyip ölçek yaratmak bana ponzi'den çok rasyonel bir yapı gibi geliyor. Anthropic kıt compute kaynağına erişim kazanıyor, Amazon ise Ar-Ge ve capex artışını haklı çıkaracak talep ve sahadan geri bildirim alıyor
  • Ben ekonomi uzmanı değilim ama Amazon'un 5 milyar dolar verip sonra o parayı 20 katıyla geri almasının nasıl mümkün olduğunu merak etmiştim
    • 5 milyar dolar sadece verilen para değil, bir özsermaye yatırımı ve aynı anda harcama taahhüdü de alınıyor diye anlıyorum. 10 yıla yayılmış 100 milyar dolarlık kullanım taahhüdü varsa, bu 5 milyar 3 yıl içinde, hatta belki daha da hızlı tükenebilir. Benim yorumumla Amazon kullanım kredisi verip karşılığında hisse alıyor; Anthropic başarılı olursa Amazon için çok iyi bir anlaşma oluyor. Başarısız olursa yatırım kaleminde zarar yazabilir ama operasyon tarafında yaklaşık 5 milyar dolarlık geliri güvenceye alıyor ve kapasite artırımı için gerekçe de kazanıyor. Anthropic açısından ise anlık rakamları tutturmasa bile daha uzun süre ayakta kalacak zamanı satın alıyor. Sonuçta Amazon'un parasıyla Amazon kapasitesini büyütmek, başkasının parasıyla kendi kapasiteni inşa etmekten daha hızlı olabilir diye düşünülmüş gibi duruyor
    • Kilit nokta, şu anda hemen büyük ölçekli compute gerektiği. Amazon bugün 5 milyar dolar yatırım yapıp sonrasında 20 milyar dolara kadar daha ekleyebileceğini söyledi; önceden de 8 milyar dolarlık yatırımı vardı. Bu anlaşmayla 3 ay içinde anlamlı ölçüde kapasite artacak ve yıl sonundan önce toplamda 1GW'a yakın bir ölçek sağlanmış olacak deniyor. Ayrıntılar Anthropic duyurusunda vardı
    • Sonuçta şimdi 5 milyar dolar alıp, zaten harcanması gerekecek compute maliyeti olarak yılda yaklaşık 10 milyar dolar ödeme yapacak bir yapı gibi düşünürsen anlamak kolaylaşıyor
    • Bu Amazon için saf 100 milyar dolarlık kâr değil; onun da operasyon maliyetleri olan bir hizmet değişimi söz konusu. Anthropic'in de bu parayı işi yürütmek için zaten harcaması gerekecek; yani bu ileride daha az ödeme yapmak gibi bir indirim değil, bugün nakit alıp ileride normal fiyatı ödemek şeklinde bir tür peşin finansman indirimi gibi duruyor
    • Ben de benzer anladım. Nasıl olsa altyapı harcaması yapacaktı; Amazon'un 5 milyar doları, bu harcamayı şart koşup AWS'ye bağlayan bir sözleşme gibi geliyor
  • Sonunda aklıma, Anthropic'in Prime Visa kartın yüzde 5 cashback avantajını kurumsal ölçekte almış olması şakası geldi. AI şirketleri de aslında bizden o kadar farklı değil gibi hissettiriyor
  • Mevcut jeopolitik ortamda bellek çipleriyle çeşitli CPU ve GPU'ların üretim kapasitesinin düşebileceğini düşünüyorum. Japonya, Güney Kore ve Singapur'la ilgili gördüğüm haberler bu kaygıyı artırdı. Eğer bu öngörü doğruysa yeni veri merkezi kurma maliyetleri sert biçimde yükselebilir diye endişeleniyorum
  • Bu çılgınlık bittiğinde sonunda vergi mükelleflerinin bu şirketleri kurtarma paketiyle desteklemek zorunda kalmasından endişeliyim
    • Bunun olması ancak buna izin verirsek mümkün olur diye düşünüyorum. Sonuçta cevap oy vermekte yatıyor gibi geliyor