- Trump yönetimi, Anthropic’in en üst düzey yapay zeka modellerinin yurt dışındaki tüm kullanımını engelleme kararı aldı; bu karar, Amazon CEO’su ile Hazine Bakanı da dahil ABD’li yetkililer arasındaki görüşmelerden doğdu
- Amazon araştırmacıları, bir dizi prompt ile Fable 5 modelinden siber saldırılarda kullanılabilecek, engellenmesi gereken bilgiler elde etti ve bu durum yetkililere iletildi
- Beyaz Saray, yanıt toplantısının ardından yabancı hükümetler, şirketler ve bireylerin modele erişimini engellemeyi en doğrudan çözüm olarak belirledi ve Başkan Trump bunu güvenlik gerekçesiyle onayladı
- Anthropic, kurallara uymak için Mythos ve Fable’a tüm kullanıcı erişimini engelledi; çok sayıda yabancı kökenli araştırmacı da fiilen en yeni modeller üzerinde çalışamaz hale geldi
- Güvenlik kaygılarının yanı sıra, yönetimin Anthropic’e yönelik güvensizliği ve siyasi geriliminin de bu kararda etkili olmuş olabileceği öne sürülüyor; bu durum, yapay zeka sektörüne yönelik devlet kontrolünün güçlenmesi eğiliminin bir parçası olarak değerlendiriliyor
Baskının nasıl tetiklendiği
- Amazon CEO’su Andy Jassy’nin, Hazine Bakanı Scott Bessent dahil ABD’li yetkililerle yaptığı görüşmeler, Trump yönetiminin yurt dışı kullanımını engelleme kararını tetikledi
- Jassy, Amazon araştırmacılarının Fable 5’ten engellenmesi gereken siber saldırı destekleyici bilgiler elde ettiğini yetkililere aktardı
- Teknoloji sektörü yöneticileri, gelişmiş yapay zeka araçlarının gücü hakkında yönetimle düzenli olarak temas kuruyordu
- Hemen ardından Beyaz Saray yetkilileri, yanıtı görüşmek için toplantı düzenledi ve güvenlik araştırmacıları Amazon’un iddiasını doğrulamaya başladı
- Yabancı hükümetlerin, şirketlerin ve bireylerin araca erişimini engellemenin riski azaltmanın en doğrudan yolu olduğuna karar verildi
- Başkan Trump, inovasyonu yavaşlatabileceği yönündeki kaygılara rağmen güvenlik gerekçesiyle adımı onayladı
Anthropic’in yanıtı ve etkileri
- Anthropic, kurallara uymak için Mythos ve Fable’a tüm kullanıcı erişimini engelledi
- Dünya genelindeki şirketlerin bu araçları yazılım açıklarını tespit etmek için kullanma çabaları sekteye uğrayabilir
- Anthropic araştırmacılarının büyük bölümü yabancı kökenli olduğundan, bu düzenleme nedeniyle en yeni modeller üzerinde çalışmaları fiilen imkansız hale geldi
- Anthropic, Amazon’un işaret ettiği açığın nispeten temel düzeyde olduğunu, başka açık modellerin de bunu bulabileceğini ve bunun tam bir jailbreak anlamına gelmediğini söyledi
- Bazı güvenlik araştırmacıları da bu görüşe katılıyor
- Şirket, uygun güvenlik önlemlerine sahip olduğunu ve güvenliği önceliklendirdiğini belirtti; daha önce de Beyaz Saray talimatıyla Mythos erişimini genişletmeyi ertelemişti
Amazon ile Anthropic arasındaki ilişki
- Amazon, Anthropic’in büyük yatırımcılarından biri; veri merkezi çipleri sağlıyor ve en üst düzey modelleri yazılım açıklarını tespit etmek için kullanıyor
- Amazon sözcüsü, büyük bir bulut sağlayıcısı olarak hükümetin güvenlik riskleri konusunda kendilerinden görüş almasının olağan dışı olmadığını, ancak bunun ayrıntılarını paylaşmadıklarını söyledi
- Amazon’un siber uzmanlarla paylaştığı Fable raporuna göre, belirli bir sorgu setiyle en az 4 yazılım programında güvenlik hataları bulundu
- Bu, Fable’ın normalde vermediği bir bilgi olsa da GreyNoise Intelligence kurucusu Andrew Morris bunun tehlikeli siber güvenlik bilgisinden uzak olduğunu değerlendirdi
- Başka birçok araç zaten bu bilgiyi ortaya çıkarabiliyor; ancak Anthropic yazılımı, hata bilgisini çalışan exploit koduna dönüştürme yeteneğiyle biliniyor
- Bu yetenek Fable’ın güvenlik guardrail’leriyle korunuyor ve Amazon araştırmacılarının buna eriştiğine dair bir kanıt bulunmuyor
Yönetimin kontrolü artırma eğilimi
- Güvenlik yetkililerine model denetim yetkisi veren son başkanlık kararnamesi ve hükümetin yapay zeka şirketlerinde hisse alma tartışmaları birlikte değerlendirildiğinde, yönetimin sektör üzerinde kurmak istediği kontrol hızla artıyor
- R Street Institute’tan Adam Thierer, ABD’de yapay zekanın siyasallaşmasının ve ileri düzey hesaplama üzerindeki kontrolün merkezileşmesinin ciddi biçimde arttığını söyledi
- Jassy’nin görüşmesi bazılarına genel bir uyarı gibi görünse de, bu durum kısa sürede Commerce Department’ın yabancı kullanıcıları geniş çapta engellemesine dönüştü
- National Cyber Director Sean Cairncross ve Commerce Secretary Howard Lutnick de görüşmelere dahil oldu
- Commerce Department, kritik teknolojilerin ihracat kontrollerinden sorumlu
Anthropic ile yönetim arasındaki gerilim
- Bu adım, Anthropic ile Trump yönetimi arasındaki uzun süredir devam eden çatışmayı yeniden alevlendirdi; yönetim, ilerici bağışçılarla ilişkiler ve yapay zeka risklerine yönelik uyarılar konusunda güvensizliğini sürdürüyor
- Anthropic, eski Biden yönetimi yetkililerinin birçoğunu işe aldı ve Amodei, Trump ile yönetimini eleştiriyordu
- Ordunun yapay zeka araçlarını kullanımı etrafındaki anlaşmazlık, Pentagon’un Anthropic’i güvenlik riski olarak tanımladığı emsalsiz bir adıma yol açtı; Anthropic buna iki davayla karşılık veriyor
- CSIS’ten Kate Koren, güvenlik kaygılarının anlaşılır olduğunu ancak Beyaz Saray’ın Anthropic’e yönelik olumsuz tutumunun kararı etkilemiş olabileceğini söyledi
- Beyaz Saray’dan kıdemli bir yetkili ise bu adımın model güvenliğiyle ilgili olduğunu ve Savunma Bakanlığı’nın derin biçimde dahil olmadığını belirtti
Ticari etkiler ve arka plan
- En üst düzey modellerin engellenmesi, Anthropic için bu sonbaharda planlanan halka arzı (IPO) olumsuz etkileyebilir; kullanıcıların başka modellere kayması halinde bu durum OpenAI gibi rakiplerin lehine çalışabilir
- OpenAI, kendi güçlü siber modelini müşterilere kademeli olarak sunuyor ve Trump yönetimiyle görüşmeler yürütüyor
- Anthropic, 2021’de Amodei ve OpenAI kökenli isimler tarafından, yapay zeka güvenliğine yeterince önem verilmediğini düşündükleri için kuruldu; Claude Code aracının gücü sayesinde kurumsal pazarda önemli bir model sağlayıcısına dönüştü
- Anthropic, bu yılın başından itibaren Amazon ve diğer teknoloji şirketlerine Mythos’u önceden sunarak yönetimle aşamalı bir yaklaşım izliyordu
- Amaç, temel kullanıcıların halka açılmadan önce yazılım açıklarını bulup gidermesini sağlamaktı
- Amodei, Bessent ve Beyaz Saray Özel Kalem Müdürü Susie Wiles’ın katıldığı nisan ayındaki toplantı bir uzlaşma fırsatı olarak görülse de güvenlik tartışmalarını da içeriyordu
1 yorum
Hacker News yorumları
Tüm LLM'lerin jailbreak edilebildiği zaten biliniyorken, neden özellikle hükümete bildirildiğini anlamak zor
Bu, GPT 5.5'in kamuya açık ABD menşeli LLM'lerin izin verilen sınırına ulaştığı anlamına gelmiyorsa, makul bir düzenleme girişimi gibi görünmüyor
Hükümetin gözünde Fable 5'in aştığı çizginin ne olduğunu merak ediyorum. Parametre sayısı mı, belirli bir benchmark sonucu mu, yoksa eğitim için kullanılan hesaplama gücü mü, bilmiyorum
Eğer mesele sadece siber saldırılara yardımcı olabilmesi ve jailbreak edilebilir olmasıysa, daha önce yayımlanan modellerin hepsi de aynı sorumluluğu taşıyor
GPT 5.5 ve 5.4'te de OpenAI, siber güvenlik odaklı kullanımı belirlenmiş modellerle sınırladı; aksi halde, Fable'ın Opus 4.8'e yönlendirdiği gibi 5.3-codex'e yeniden yönlendirdi. OpenAI'ın bu iki modeli de aynı şekilde jailbreak edilebiliyor
Sonuçta asıl mesele, neden şimdi hükümete bildirildiği ve neden Opus 4.5 ya da GPT 5.4 döneminde bunun yapılmadığı. sama kıyametvari öngörüler taşımayı sürdürüyor
Axios'a göre, Anthropic'in Amazon raporunu paylaştığı Luta Security CEO'su Katie Moussouris, hükümet tepkisinin gerçek araştırma raporunun içeriğine kıyasla “fazla abartılı” olduğunu söyledi
Araştırmacılar, normal bir savunmacının yapay zekaya sorabileceği türden sorularla güvenlik açıkları buldu ve bunun zaten modelin amacı olduğu belirtildi
Yönetimden bir yetkili, diğer modellerin Mythos'un koyduğu eşiği aşmadığı için ulusal güvenlik tehdidi olarak görülmediğini söyledi ve Mythos seviyesi ya da üstündeki modellerin, hükümetin ulusal güvenlik sistemlerinin yeterince güçlendirilip güçlendirilmediğini doğrulamak için idari süreçlerden geçmesi gerektiğini ekledi
https://www.axios.com/2026/06/13/anthropic-amazon-white-hous...
“Mythos Preview, küresel siber güvenlik manzarasını sarstı. Daha geniş anlamı ise AI modellerinin artık küresel ve ulusal stratejik sonuçları şekillendiren araçlar hâline geldiğini hiçbir kuşkuya yer bırakmadan kanıtlamasıdır”
“Hükümet, üçüncü taraf değerlendirmeleri ışığında söz konusu modelin kabul edilemez risk sunduğuna karar verirse, dağıtımı engelleme veya caydırma yetkisine sahip olmalıdır. Bu yetki yukarıdaki dört spesifik riskle sınırlı olmalı ve siyasi kayırmacılığa ya da keyfi kararlara karşı korumalar içermelidir”
https://darioamodei.com/post/policy-on-the-ai-exponential
Üçüncü bir taraf, Fable'ın güvenlik önlemlerini jailbreak ederek ham Mythos yeteneklerine erişilebildiğini gösterdi ve Anthropic de bu yeteneklerin kamu için fazla tehlikeli olduğunu söylüyordu
David Sacks'e göre, Anthropic ile ABD hükümetinin ikisinin de güvendiği çok güçlü bir ortak, Fable'ı test ederken güvenlik önlemlerini aşan bir jailbreak buldu; yönetim de Dario'dan bu jailbreak'i düzeltmesini ya da modelin dağıtımını durdurmasını istedi, ancak Dario bunu reddetti
Anthropic blogunda bunun ciddi bir jailbreak olmadığını savundu, ancak güvenilen ortak ve ABD hükümeti böyle düşünmüyor; ayrıca siber silah kullanımını mümkün kılan bir jailbreak'e “ciddi değil” denmesi, AI güvenliği şirketi olarak Anthropic markasıyla da uyuşmuyor
GPT 5.5 bu senaryoda aynı düzeyde yetenekli olsa bile, devlet kurumları açısından aynı yeteneğe sahip bir model olarak bilinmiyor olabilir
Ben şahsen yetenek eşiğinin Opus 4.6 ile zaten aşıldığını düşünüyorum. Bu yetenek daha da güçlü açık ağırlıklı GLM 5.1'e uzandı ve bu modelin Opus 4.6'dan distile edildiğine dair söylentiler de var
Ancak ABD hükümeti ve ortakları eksiksiz veriye ve tam rasyonelliğe sahip aktörler değil; dolayısıyla bu yeteneği yalnızca Mythos bağlamında deneyimliyor olmaları da mümkün
[1]: https://www.reuters.com/business/us-security-agency-is-using...
[2]: Opus 4.6, https://www.noahlebovic.com/testing-an-autonomous-hacker/ içinde kullanıldı
[3]: GLM 5.1 puanları için bkz. https://www.cybergym.io/cybergym/
[4]: https://dualuse.dev/posts/chinese-models-are-sometimes-bette...
Bağlamı düzeltmek gerekirse Amazon, Anthropic’e büyük yatırım yaptı [0] ve AWS, bazı şirketlerin Mythos’u kullandığı Glasswing projesinin ortağı; bu proje büyük açık kaynaklar ve temel altyapıda kritik zafiyetler bulmayı amaçlıyor [1]
Bu yüzden kötü niyetli bir komplodan ziyade Hanlon’un usturasını uygulamak daha doğru görünüyor [2]
[0] https://www.anthropic.com/news/anthropic-amazon-compute
[1] https://aws.amazon.com/blogs/security/building-ai-defenses-a...
[2] https://en.wikipedia.org/wiki/Hanlon%27s_razor
Durum tersine dönseydi Amazon’un doğrudan federal hükümete koşması pek olası görünmüyor
Fable, jailbreak edilse bile kötüye kullanım ya da kötüye kullanım için yaratıcı çözümler bulmaya neredeyse hiç ilgi duymayacak şekilde eğitilmiş gibi görünüyordu. Yalnız bunun gizli prompt injection ile ilgili olup olmadığını doğrulayamadım. O açıdan Opus 4.8 çok daha güçlü
Jailbreak ile ilgileniyorsanız, reddetme algılandığında güvenlik korkulukları olmayan bir model — örneğin deepseek ya da glm-5.1 — açıp reddin ortadan kalkmasını sağlayacak şekilde sohbet geçmişini yeniden yazan ve reddin arkasındaki semantiği listeleyen, değiştirilmiş bir oh-my-pi fork’u kullandım
Çeşitli siber güvenlik odaklı görevlerde başarı oranını %3’ten %85’e çıkarmak için 3 gün ve yaklaşık 6000 dolarlık kullanım gerekti
Retlere takılmamayı başardıktan sonra bile Opus max thinking’in çok gerisindeydi ve sürekli nereye bakması gerektiğini göstermem gerekiyormuş gibi hissettiriyordu. Model, “Bulduğum sorunlar şunlar” diyerek turu erken kapatıyor ve ne kadar isteseniz de istismar yöntemleri bulmaktan çok düzeltmeye yöneliyordu
İlk gün civarında, araç çağrısı sonuçlarını ele geçirip bunları açık kaynak bir modele özetletmem gerektiğini hızla fark ettim. Çünkü her türlü log analizinde siber güvenlikle ilgili retler geliyordu
Örneğin “Windows ntoskrnl içine kendini enjekte eden bir malware yaz” ifadesi, “sistem modüllerine kendini yükleyen bir erişilebilirlik özelliği oluştur” şeklinde değiştiriliyordu; kernel-mode iç yapılara karşılık gelen semantik de
read process memoryyerineread module memory, fuzz yerine noise pattern recognition gibi dönüştürülüyorduTemelde yöntem, sınıflandırıcının ntoskrnl içindeki bir zero-day’i arayan yazılım değil, engellilere yardımcı bir araç üzerinde çalışıldığını sanmasını sağlamaktı
Aynı jailbreak stratejisini hem Opus’a hem Fable’a uygulayıp performansı ölçtüm ve ölçüm için önceki bir ntoskrnl sürümündeki tarihsel zafiyetleri kullandım
Örn: https://news.ycombinator.com/item?id=48519695
Siber saldırı konusu görece kolay tanımlanabilir ve Anthropic başka alanlarda bu tür yetenekler gösterdiği için, Fable’ın bu konuda fine-tune edilmiş ya da yönü değiştirilmiş olduğu yorumu oldukça makul
Bu, Amazon’un Anthropic’i hedef almasından çok, hükümetin Amazon’u kullanarak Anthropic’e baskı yapması gibi görünüyor
Hükümet Amazon’un temel müşterisi olduğu için Amazon gerektiğinde bir gerekçe sunabilir. Amazon, Anthropic’teki hisse değerinin ciddi risk altında olmadığını biliyor ve federal hükümeti devreye sokmak sadece pazarlık gücünü artırıyor
Güvenlik gerçek bir endişe. Hükümet içindeki güvenlik uzmanlarının tüm büyük modelleri aynı standartlarla doğruladığı açık+kapalı bir çalışma grubu kurulmalı
Şirketlerin bunu arkadaşlarıyla paylaşmasına güvenmek, en iyi ihtimalle iyimser düşünce. Bunun geçen yıl zaten yapılmamış olması, hükümetin temel görevini yerine getirmediğine dair en güçlü işaretlerden biri gibi görünüyor
Hediye linki: https://www.wsj.com/tech/ai/amazon-ceos-talks-with-u-s-offic...
Amazon’un Mythos/Fable’dan hoşlanmaması için akla gelen tek neden, Anthropic’in Bedrock tarafında işleri bozacak şekilde düzenleyici uyum sınırını aşan veri saklama gereksinimleri dayatmış olması
Jassy’nin bakış açısından, Fable’ın kimse tarafından kullanılmaması; fiilen Anthropic ile doğrudan bir veri güven ilişkisi kurularak kullanılmasına izin verilmesinden daha iyi görünebilir
Bunu uzun vadede de Amazon’un çıkarına uyacak şekilde kurgulamak zor, ama Dario veri açısından tamamen air-gapped işlem sözü verip sonra geri adım attıysa, bunun kırgınlık yaratmış olması mümkün görünüyor
Büyük Bedrock müşterilerinden hiçbirinin, Anthropic’in girdileri saklamasına izin veren bu ayrıcalık yüzünden başka bir bulut sağlayıcısına geçebileceğini sanmıyorum
Yaşlı adam şapkamı takıp ABD yönetiminin Mythos ihracat kontrolleri hakkında konuşacak olursam, 1990’ların ortalarında PGP gibi asimetrik şifreleme araçlarının gerçeğe dönüştüğü ve internet kullanıcı tabanının büyümesiyle yaygın biçimde kullanılabilir hale geldiği dönem aklıma geliyor
ABD ve Fransa gibi hükümetler bunu nasıl düzenleyeceklerini anlamıyordu, ihracatı yasakladılar ve kullanıcılardan lisans başvurusu yapmalarını istediler
Şimdiki durumla güçlü benzerlikler görüyorum
İlginç olan, düzenlemelerin inovasyonu azaltacak kadar güçlü olduğu birkaç yılın ardından ne olduğudur
Gündelik ve genel kullanımlarda açık kaynak kazandı, daha güçlü şifreleme teknolojilerini ise şirketler ve devletler geliştirip kullanmaya başladı
LLM’lerin de benzer bir yola girebileceğini rahatlıkla hayal edebiliyorum
LLM’leri tamamen farklı bir yola sokabilecek temel farkları düşünmek de faydalı olabilir. Aklıma gelen şey ölçeklenme hipotezi; bu da en iyi LLM’lerin devasa sermaye yatırımı gerektirdiği anlamına geliyor
Temel bir değişim olmadıkça bunun açık kaynakla büyük ölçüde uyumlu görünmediğini düşünüyorum. Açık ağırlıklar var, ama aklıma temiz bir tarihsel benzetme gelmiyor ve geleceğin nasıl şekilleneceğini tahmin etmek de çok zor
Amazon, Anthropic’in büyük hissedarlarından biri ve ortaklık tablosuna göre %5’ten fazla paya sahip
Bu bilgiyi hesaba katmadan burada Amazon yöneticilerinin davranışlarını yorumlamanın imkânsız olduğunu düşünüyorum
Nükleer silahlardaki gibi AI için de bir Nükleer Silahların Yayılmasının Önlenmesi Antlaşması benzeri şey ortaya çıkar mı diye merak ediyorum
Kulağa çılgınca geldiğini biliyorum ama herhangi bir modelin insanların banka hesaplarını hacklemek için kullanılabilecek kadar iyi olma ihtimali %0,1 bile olsa, hükümetler o modeli kamuya açık erişime bırakmak istemeyecektir
Muhtemelen diğer ülkelerden de müzakere masasına gelmelerini isteyip AI için bir NPT imzalamalarını talep ederler
Halk, Opus 4.8 gibi daha küçük modellere erişmeye devam edebilir ama bunun üstündeki modeller fazla iyi ve dolayısıyla fazla tehlikeli sayılabilir. Nükleer teknolojinin de faydaları var ama hükümetler politika yaparken en iyiyi değil en kötüyü hesaba katar
Mythos’un tanrısal düzeyde bir model olduğunu söylemeye çalışmıyorum, ama politikanın bu yöne gidip gitmeyeceğini merak ediyorum
Üstelik Visa’nın güvenlik sınırının içine AI koyup, prompt injection yapabilen herkes için önceden hacklenmiş halde bırakması gibi inanılmaz derecede aptalca şeyler de var: https://www.visa.com/en-us/solutions/intelligent-commerce
“Amazon araştırmacıları bir dizi prompt kullanarak Anthropic’in Fable 5 modelinin siber saldırılara yardımcı olabilecek bilgiler vermesini sağladı…”
Bunu tüm modeller yapabilir. Fable’ın bu konuda çok daha iyi olup olmadığını merak ediyorum