Anthropic, SpaceX ile yaptığı compute anlaşmasıyla Claude kullanım limitlerini 2 katına çıkardı
(anthropic.com)- Anthropic, SpaceX ile yaptığı ortaklık ve kısa süre önce imzaladığı çeşitli compute anlaşmaları sayesinde Claude Code ve Claude API kullanım limitlerini artırdığını duyurdu
- Claude Code’un 5 saatlik kullanım sınırı 2 katına çıkarıldı (Pro, Max, Team ve koltuk bazlı Enterprise planları) ve Pro ile Max hesaplarındaki yoğun saatlerde limit düşürme uygulaması kaldırıldı
- Claude Opus modelinin API rate limits değerleri de önemli ölçüde yükseltildi; ek kapasite, Claude Pro ve Claude Max abonelerinin kullanım imkanını doğrudan iyileştiriyor
- Anthropic, SpaceX’in Colossus 1 veri merkezinin tüm compute kapasitesini kullanmak üzere anlaşma yaptı; böylece bir ay içinde 300MW’ı aşan yeni kapasiteye ve 220 binden fazla NVIDIA GPU’ya erişebilecek
- Anthropic’in compute genişlemesi; Amazon, Google ve Broadcom, Microsoft ve NVIDIA ile Fluidstack anlaşmalarına ek olarak ilerliyor; bölgesel altyapı, elektrik maliyeti yükü ve topluluk yatırımları da birlikte değerlendiriliyor
Claude kullanım limitlerinin artırılması
- Anthropic, SpaceX ile ortaklığı ve kısa süre önce yaptığı çeşitli compute anlaşmaları sayesinde Claude Code ve Claude API kullanım limitlerini yükseltiyor
- 3 değişiklik de duyurunun yapıldığı gün yürürlüğe girdi
- Pro, Max, Team ve koltuk bazlı Enterprise planlarında Claude Code’un 5 saatlik kullanım sınırı 2 katına çıkarıldı
- Pro ve Max hesaplarında Claude Code’un yoğun saatlerde limit düşürme uygulaması kaldırıldı
- Claude Opus modelinin API rate limits değerleri de önemli ölçüde yükseltildi
SpaceX ile yeni compute ortaklığı
- Anthropic, SpaceX’in Colossus 1 veri merkezinin tüm compute kapasitesini kullanmak üzere anlaşma yaptı
- Bu anlaşma sayesinde bir ay içinde 300MW’ı aşan yeni kapasiteye ve 220 binden fazla NVIDIA GPU’ya erişebilecek
- Ek kapasite, Claude Pro ve Claude Max abonelerinin kullanım imkanını doğrudan iyileştiriyor
- Bu anlaşma, Anthropic’in daha önce duyurduğu büyük compute genişlemelerine ekleniyor
- Amazon ile 5GW’a kadar anlaşma: 2026 sonuna kadar yaklaşık 1GW yeni kapasite dahil
- Google ve Broadcom ile 5GW anlaşması: 2027’den itibaren devreye girmesi planlanıyor
- Microsoft ve NVIDIA ile stratejik ortaklık: 30 milyar dolarlık Azure kapasitesi dahil
- Fluidstack ile ABD yapay zeka altyapısına $50 milyar yatırım
- Claude’un eğitimi ve çalıştırılmasında AWS Trainium, Google TPUs, NVIDIA GPUs gibi çeşitli yapay zeka donanımları kullanılıyor
- Anthropic, ek kapasiteyi çevrimiçi olarak devreye alma fırsatlarını aramayı sürdürüyor
- SpaceX anlaşmasının bir parçası olarak, birkaç GW ölçeğinde yörüngesel yapay zeka compute kapasitesi geliştirmek için SpaceX ile iş birliği yapmaya da ilgi gösteriyor
Uluslararası genişleme ve bölgesel altyapı
- Finansal hizmetler, sağlık ve kamu gibi yüksek düzenlemeye tabi sektörlerdeki kurumsal müşteriler; uyumluluk ve veri yerleşimi gereksinimlerini karşılamak için giderek daha fazla bölgesel altyapıya ihtiyaç duyuyor
- Buna bağlı olarak, Anthropic’in kapasite genişlemesinin bir bölümü uluslararası olarak ilerliyor
- Amazon ile yakın zamanda duyurulan iş birliği, Asya ve Avrupa’da ek çıkarım kapasitesini içeriyor
- Kapasite eklenecek bölgeler dikkatle seçiliyor ve büyük ölçekli yatırımları destekleyebilecek hukuki ve düzenleyici çerçeveye sahip demokratik ülkelerle çalışılıyor
- Compute için gerekli donanım, ağ ve tesis tedarik zincirinin güvenli olması da önemli bir kriter
Elektrik maliyetleri ve topluluk yatırımı
- Anthropic, ABD’de veri merkezleri nedeniyle tüketici elektrik faturaları artarsa bunu karşılayacağını yakın zamanda taahhüt etti
- Uluslararası genişlemenin bir parçası olarak, bu taahhüdü yeni yargı alanlarına genişletmeyi değerlendiriyor
- Tesislerin bulunduğu topluluklara yeniden yatırım yapmak için yerel liderlerle iş birliği yolları da araştırılıyor
1 yorum
Hacker News görüşleri
Buna karşılık eğitim pahalı kalmaya devam ediyor, bu yüzden Anthropic/OpenAI eğitim işine yöneliyor
Modeller kiralanabilen ya da satın alınabilen varlıklara dönüşüyor; kullanıcılar da çıkarım donanımı üzerinde çalıştırıyor, çıkarım donanımı kiralıyor ya da sahip oluyor
Ya da tüm bunları onlar adına yapan şirketlere prim ödüyor
Opus gibi yeni modellerin yalnızca çıkarım tarafında bile nasıl bir altyapı kullanıldığını anlatan blog yazıları var mı diye merak ediyorum
Muhtemelen gizlidir ama AWS Bedrock üzerinden modeli doğrudan kullanabiliyorsak bu bir miktar ipucu sayılmaz mı diye düşünüyorum
Veri merkezlerinde işletme ölçeğini büyütme hızı çoğu zaman maliyetten daha önemli olduğu için bazen aptalca yöntemlerle çalışılıyor
Elektrik şirketi regülasyonları var ve şebekeyi bozmamak için ramp rate gibi kurallar bulunuyor, ama veri merkezlerinin bunları ciddi biçimde ihlal ettiği anlatılıyor
Yük dalgalanması yüksek; sayaç arkası doğal gaz jeneratörleriyle güç sağlanıyor ve normalde 7 yıl gitmesi gereken miller tekrar eden başlatma-durdurma yüzünden sadece 10 ay dayanıyor deniyor
https://www.volts.wtf/p/doing-data-centers-the-not-dumb-way
Bilişim tarafında ise NVIDIA'nın standart referans tasarımı var
https://www.nvidia.com/en-us/technologies/enterprise-referen...
Detayına bakmadım ama muhtemelen GPU'lar arası Mellanox ağı, tensörleri GPU'lara bölen büyük ölçekli özel kodlar ve aktivasyonları GPU düğümleri arasında taşıyan kodlar vardır
Anthropic, kendi modelini AWS Bedrock içinde yönetilen hizmet olarak barındırıyor ve müşteri başka bir API çağırır gibi LLM'i çağırıyor
Bu API isteğini hangi AWS altyapısının karşıladığı görünmüyor
Grok için kurulmuş, para yutan bir varlığı IPO öncesinde oldukça büyük bir gelir kaynağına dönüştürüyor
Aynı zamanda Twitter borcunu halka yıkmanın bir aracı da oluyor; muhasebeciler gerçekten işlerini biliyor gibi
Anthropic büyümeyi sürdürmek için çaresizce ihtiyaç duyduğu hesaplama gücünü alıyor, Elon Grok'a talep az olduğu için xAI'ın tam kullanamadığı kapasiteyi kiralıyor ve SpaceX de IPO defterlerine gelir yazabiliyor
“Bu ölçekteki yatırımı destekleyecek hukuki ve düzenleyici çerçeveye sahip demokratik ülkelerle iş birliği yaparak kapasiteyi dikkatli biçimde artıracağız” cümlesi gerçek dile çevrilirse “kârı her şeyin önüne koyacağız” anlamına geliyor
Elon, Trump'ı destekleyen aşırı sağ eğilimli bir figür ve Trump da pek demokratik değil ama demek ki paraya gerçekten daha çok ihtiyaçları var
Sanırım xAI'ın Orta Doğu'daki demokratik olmayan hükümetlerden fon aldığını unutturmaya da çalışıyorlar; Anthropic modellerini satabildikleri sürece Çin'den hesaplama gücü de alırlar gibi geliyor
Veri merkezleri iyi yazılmış spesifikasyonlara ve uluslararası standart arayüzlere sahip tak-çalıştır ekipmanlar değil sonuçta
Elon yörüngede veri merkezi kurmak istiyorsa, Anthropic orada model çalıştırmaya gayet razı olur
Elon'un yörüngesel veri merkezi kurup kuramayacağına çok da şüpheyle bakmıyorum; asıl soru bunun yer tabanlı seçeneklerden ekonomik olarak mantıklı olup olmadığı
Olursa olur, olmazsa olmaz
Yerdeki veri merkezlerine erişim almak için yapılan anlaşmanın bir parçası olarak, açıkça saçma olan uzay yörüngesi hesaplamasını olduğundan büyük gösteriyorlar
Bir gün böyle bir şey olabilir diye düşünüyorum ama FSD gibi, gerçekleşmeye hiç yakın görünmüyor
Bunu söylemenin maliyeti neredeyse sıfır ve sonra da ilgilerini kaybettiklerini söylerler
Bir maliyeti varsa o da biraz itibar kaybıdır
Şebekeye ek talep bindirirken aşırı hava olaylarında büyük kesintilere yol açıp bölge halkını daha da riskli hale getirme ihtimali de yüksek
https://en.wikipedia.org/wiki/Colossus_(supercomputer)#Envir...
Bu yüzden Anthropic de güvenlikten çok söz etse de pratikte güvenlikten önce kârı koyan şirketler listesine yazılabilir
Verdiğin Wikipedia bağlantısında bile izinlerle ilgili gri alanlar olabileceği yazıyor ama elektriğin “kaçak” olduğuna dair bir iddia görmedim
Kimyasal üretmiyorlar ve böyle bir iş yapmıyorlar
Bu tür iddialara karşı çok şüpheci olmak gerekir; özellikle de işin içinde parası bol şirketler varsa, sadece “makul görünen ve ısrarla sürdürülen” zarar iddialarıyla bile dava açılabilir ya da uzlaşmaya zorlanılabilir
Doğruysa bu devasa bir vergi açığı ve veri merkezlerine yapılan sermaye yatırımının yüksek olması da şaşırtıcı değil
[0] https://www.datacenterknowledge.com/regulations/how-are-data...
Bunun anlamı, haftalık limite 5 gün yerine 3 günde ulaşabilmendir
Yoğun kullandığım haftalarda günde 6 saatten fazla düzenli kullanıyorum
Ama seansları hep 200 bin ila 250 bin token'ın altında tutmak konusunda oldukça katıyım
Haftada 3-5 seans kullanıyorum
Daha karmaşık işler yapınca 5 saatlik pencereyi hızla tükettiğim için sinir bozucu oluyor ama haftalık limite henüz ulaşmadım
Sanırım benim gibi epey kişi vardır
Gerçekten yüklenirsen aylık $200 Max paketinin haftalık limitini bile bir günde rahatça bitirebilirsin
Aklımda haftalık kullanımı günlük bazda, yani günde yaklaşık %14 olarak hesaplayıp haftanın başında daha az, sonunda daha rahat harcamaya çalışıyorum
Sonra son iki günde biriktirdiğim kullanım hakkını nasıl tüketsem diye düşünmeye başlıyorum
5 saatlik pencere bunu daha da zorlaştırıyor; haftanın son gününde, uyanık olduğum her anda her 5 saatlik pencereye %10 sıkıştırmaya çalışıyorum ve bundan gerçekten nefret ediyorum
En verimli olduğum saatte çalışmak istiyorum, saçma sapan zaman pencerelerine göre değil
“Claude'u en çok 11'de kullanırım herhalde, o zaman 5 saatlik pencere başlasın da 12:30'da yeniden geçeyim diye 7:30'da Haiku'ya aptal bir mesaj atayım” diye düşünmek istemiyorum
O yüzden bu değişiklik hoşuma gidiyor ama bu, tamamen kendi yarattıkları bir sorunu biraz hafifletip kullanıcılara lütuf yapıyormuş gibi davranmalarından ibaret
Yoğun saatlerdeki kullanımı düşürmek istediklerini anlıyorum ama yine de hoşuma gitmiyor
Sonuç olarak Elon'un xAI'dan vazgeçip hesaplama gücü satmaya yöneldiği izlenimi oluşuyor
Grok 4.1 Fast, X üzerinde araştırma yapmanın en ucuz yoluydu; X API'den bile ucuzdu ama 15 Mayıs'ta ortadan kalktı
https://docs.x.ai/developers/models
Belki satmak için hesaplama kapasitesini boşaltıyorlardır
Ama Gemma ve Qwen gibi açık kaynak modeller o kadar hızlı gelişiyor ki, Anthropic bile uzun vadede kendi modeli ve araçlarının değerinin gerçekten risk altında olduğunu düşünüyor olabilir
Temelde ben Anthropic ya da xAI olsam mümkün olan her yerden gelir üretir, neyin ayakta kaldığını görürdüm
Her şey bu kadar oynakken tekel peşinde koşmanın pek anlamı yok
Sadece boşa giden GPU zamanı da olabilir ama Anthropic'in reddetmesi zor bir teklif yapmış olmaları da mümkün
Tahmin yürütecek olursam, Elon'un reddedemeyeceği teklif Anthropic'in bir miktar eğitim verisi ya da teknoloji sağlaması olabilir
xAI'ı ciddi bir araştırma laboratuvarı olarak görmek zor
Claude'un nasıl çalıştığına dair içeriden bilgi elde ediyorlar ve Claude kullanım verisinin devasa akışına da erişiyorlar
Tüm bunlar gelecekteki Grok geliştirmelerine yansıyacaktır
Birkaç gündür Claude Code kullanıyordum ve sürekli limite takıldığım için Max'e yükseltmeyi düşünüyordum ama yükseltme akışında Persona üzerinden kimlik doğrulama istendi
Tamam deyip yükseltmeyi iptal etmeye çalıştım ama mevcut planımdaki Claude Code erişimim de tamamen kilitlendi ve kimlik doğrulamayı tamamlamadan açılamaz hale geldi
Bunu asla yapmayacağım ve gerçekten kötü bir deneyimdi
Tek iyi tarafı, Deepseek'in çok daha ucuz olduğunu ve tersine mühendislik işlerinde benzer düzey sunduğunu fark etmem oldu
Güzel haber ama geri dönmeyeceğim
Anthropic beni çok kısa sürede çok fazla hatayla kaybetti
Opus'un yerini GPT 5.5, DeepSeek, Kimi ve Qwen aldı; hepsi tek bir harness kullanarak modelleri kolayca değiştirmeme izin veriyor
İçlerinden biri de aynı şekilde davranmaya başlarsa anında değiştiririm