AlphaEvolve: Etkisini Birçok Alana Yayan Gemini Tabanlı Kodlama Ajanı
(deepmind.google)- AlphaEvolve, Gemini tabanlı bir kodlama ajanı; gelişmiş algoritma tasarımıyla başlayıp matematik ve bilgisayar bilimlerindeki açık problemlere, Google altyapısının optimizasyonuna ve bilimsel ile endüstriyel görevlere kadar uygulama alanını genişletiyor
- Genomikte DeepConsensus'u geliştirerek varyant tespit hatalarını %30 azalttı; elektrik şebekelerinde ise AC Optimal Power Flow probleminin uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmaya katkı sağladı
- Yer bilimlerinde Earth AI model optimizasyonunu otomatikleştirerek orman yangını, sel ve hortum dahil 20 doğal afet kategorisinde risk tahmininin genel doğruluğunu %5 artırdı; kuantum fiziğinde ise Willow quantum processor üzerinde mevcut temel ölçüte kıyasla hatası 10 kat daha düşük kuantum devreleri önerdi
- Matematikte Terence Tao ile birlikte Erdős problemi'nin çözümüne katkı sundu; ayrıca Traveling Salesman Problem ve Ramsey Numbers için alt sınırları iyileştirmede, yorumlanabilir sinirbilim modellerinde, mikroekonomide, kriptografide, sentetik veride ve yapay zeka güvenliği önlemlerinde kullanıldı
- Google altyapısında yeni nesil TPU tasarımı, cache replacement policy, Google Spanner'ın LSM-tree compaction heuristic'i ve derleyici optimizasyonlarında kullanıldı; ticari uygulamalarda ise Klarna’da eğitim hızını 2 katına çıkardı, FM Logistic’te rota verimliliğini %10,4 iyileştirdi, Schrödinger’de MLFF eğitim ve çıkarımını yaklaşık 4 kat hızlandırdı
Toplumsal etki ve sürdürülebilirlik
-
Genomik
- AlphaEvolve, Google Research tarafından geliştirilen DNA dizileme hata düzeltme modeli DeepConsensus'u iyileştirmek için kullanıldı ve varyant tespit hatalarını %30 azalttı
- Bu iyileştirme, PacBio bilim insanlarının genetik verileri daha doğru ve daha düşük maliyetle analiz etmesine yardımcı oluyor
- PacBio’dan Aaron Wenger, AlphaEvolve ile bulunan çözümün dizileme ekipmanlarının doğruluğunu anlamlı biçimde artırdığını ve araştırmacıların daha yüksek kaliteli verilerle daha önce gizli kalmış hastalığa yol açan mutasyonları keşfedebileceğini söyledi
-
Elektrik şebekesi optimizasyonu
- AlphaEvolve, AC Optimal Power Flow problem'e uygulandı
- Eğitilmiş Graph Neural Network(GNN) modelinin bu problem için uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmasına katkı sağladı
- Bu sonuç, elektrik şebekelerinde maliyeti yüksek son işleme aşamalarına duyulan ihtiyacı büyük ölçüde azaltıyor
-
Yer bilimleri
- AlphaEvolve, karmaşık jeo-uzamsal verileri daha güvenilir ve uygulanabilir içgörülere dönüştürmek için kullanılıyor
- Earth AI model optimizasyonunu otomatikleştirerek, orman yangını, sel ve hortum dahil 20 kategoriyi birleştiren doğal afet risk tahmininin genel doğruluğunu %5 artırdı
Araştırma cephesindeki ilerlemeler
-
Kuantum fiziği
- AlphaEvolve optimizasyonu, Google’ın Willow quantum processor'unda karmaşık molekül simülasyonlarının çalıştırılmasını mümkün kılıyor
- Geleneksel optimizasyon temel ölçütlerine kıyasla hatası 10 kat daha düşük kuantum devreleri önererek, türünün ilk örneği olan kuantum hesaplama deney gösterimine doğrudan katkı sundu
- Bu başarı, AlphaEvolve’un klasik bilgisayarların kapasitesini aşan algoritmaları bulabileceği bir geleceğe işaret ediyor
-
Matematik
- AlphaEvolve, Terence Tao gibi matematikçilerle birlikte Erdős problemi'nin çözümüne katkı sundu
- Terence Tao, AlphaEvolve gibi araçların özellikle optimizasyon problemlerinde olası eşitsizlik karşı örneklerini hızlıca test etmeye veya uç değer nesnelerine dair inançları doğrulamaya yardımcı olarak sezgiyi ciddi biçimde geliştirdiğini ve katı kanıtların daha kolay bulunmasını sağladığını belirtti
- AlphaEvolve, Traveling Salesman Problem ve Ramsey Numbers gibi klasik matematik problemlerinin alt sınırlarını iyileştirerek yeni rekorlar kırdı
-
Diğer araştırma alanları
- AlphaEvolve’un otonom keşif yeteneği birçok alanda paralel yenilikleri tetikliyor
- Yorumlanabilir sinirbilim modeli keşfi, mikroekonomide yeni piyasa sınırı kanıtları ve sinir ağı bileşenleri alanlarındaki ilerlemelerde kullanıldı
- Ayrıca kullanıcı gizliliği için kriptografi, sentetik veri üretimi ve frontier yapay zeka modelleri için temel güvenlik önlemleri üzerinde de uygulandı
- AlphaEvolve’un “Tammes problem” örneklerini optimize ettiği bir örnek ile ek problemlere yönelik potansiyel çözümler, herkese açık Gallery içinde görülebilir
Yapay zeka altyapısında iyileştirmeler
- AlphaEvolve, pilot testlerin ötesine geçerek Google altyapısının temel bileşenlerinden biri haline geldi
- Yeni nesil TPU tasarımlarını optimize etmek için düzenli bir araç olarak kullanılıyor
- Daha verimli cache replacement policy keşfederek, daha önce insanların aylar süren yoğun emeğini gerektiren bir işi yalnızca iki günde başardı
- Jeff Dean, AlphaEvolve’un yapay zeka yığınını çalıştıran donanımın en alt seviyelerini optimize etmeye başladığını ve sezgiye aykırı ama verimli devre tasarımları önererek bunların doğrudan yeni nesil TPU silikonuna entegre edildiğini söyledi
- AlphaEvolve, Google Spanner'ın Log-Structured Merge-tree compaction heuristic'ini iyileştirerek verimliliği artırdı
- Bu optimizasyon, başlangıçtaki isteğe kıyasla depolamaya yazılan veri oranı olan yazma yükseltmesini (write amplification) %20 azalttı
- AlphaEvolve ayrıca yazılımın depolama alanı kullanımını neredeyse %9 azaltan yeni bir derleyici optimizasyon stratejisine dair içgörüler de sağladı
Ticari uygulamaların genişlemesi
- Google Cloud ile birlikte AlphaEvolve, çeşitli sektörlerdeki ticari şirketlere sunuluyor
- Finansal hizmetlerde Klarna, AlphaEvolve’u kullanarak büyük transformer modellerinden birini optimize etti ve model kalitesini artırırken eğitim hızını 2 katına çıkardı
- Yarı iletken üretiminde Substrate, AlphaEvolve’u hesaplamalı litografi çerçevesine uygulayarak çalışma süresini birkaç kat hızlandırdı ve daha büyük ölçekli gelişmiş yarı iletken simülasyonlarının çalıştırılmasını mümkün kıldı
- Lojistikte FM Logistic, Traveling Salesman Problem gibi karmaşık rota problemlerini optimize ederek, hâlihazırda güçlü biçimde optimize edilmiş çözümlere kıyasla rota verimliliğini %10,4 iyileştirdi ve yılda 15.000 km’den fazla mesafe tasarrufu sağladı
- Reklam ve pazarlamada WPP, AlphaEvolve ile yapay zeka model bileşenlerini rafine etti ve karmaşık yüksek boyutlu kampanya verileri üzerinde çalışarak rekabetçi manuel model optimizasyonuna kıyasla doğruluğu %10 artırdı
- Hesaplamalı malzeme ve yaşam bilimlerinde Schrödinger, AlphaEvolve’u uygulayarak Machine Learned Force Fields(MLFF) eğitiminde ve çıkarımında yaklaşık 4 kat hızlanma elde etti
- Schrödinger’den Gabriel Marques, daha hızlı MLFF çıkarımının ilaç keşfi, katalizör tasarımı ve malzeme geliştirmedeki Ar-Ge döngülerini kısaltarak şirketlerin molekül adaylarını aylar yerine günler içinde elemesine olanak tanıdığını ve bunun somut ticari etki yarattığını söyledi
Gelecek yönü
- Son 1 yılda AlphaEvolve, çok amaçlı genel bir sistem olarak hızla konum kazandı
- Bir sonraki büyük atılımın kendi kendine öğrenebilen, evrilebilen ve optimize olabilen algoritmalar tarafından yönlendirilebileceğini gösteriyor
- Google DeepMind, AlphaEvolve’un yeteneklerini genişletmeyi ve onu daha geniş dış problemlere uygulamayı hedefliyor
1 yorum
Hacker News yorumları
Antirez'in "Don't fall into the anti-AI hype" [0] yazısını hatırlatıyor
Tek cümlelik özeti şu: Bu tür temel modeller, “matris çarpımını daha hızlı yap” gibi çok yüksek seviyeli ama aynı zamanda çok iyi tanımlanmış problem alanlarını optimize etmede gerçekten çok güçlü. Antirez'in durumunda bu, “Redis'i daha hızlı yap” idi
Tepkiler “benim işimde asla işe yaramaz” ile “aylar sürecek işi bir saatte bitirdi” arasında bölündü ve bence ikisi de doğru. Antirez'in sonrasında da sonuç almaya devam etmesi sevindirici [1], ama çoğu insanın yaptığı, örtük bilginin bol olduğu, insan sistemleri merkezli ve muğlak tanımlanmış işler LLM'lerin zorlandığı işler olabilir ya da baştan beri bunun için tasarlanmamış da olabilir diye düşünüyorum
[0] https://antirez.com/news/158
[1] https://antirez.com/news/164
Yakında tüm toplantılar kaydedilip yazıya dökülecek ve ajanların muğlaklıkla karşılaştığında arayabileceği, iyi indekslenmiş bir yerde tutulacak. Şu anda bana sorabiliyorsa, böyle bir ortam kurulduğunda cevabı kendisi de arayıp bulabilir. Aslında iyi dokümante edilmiş bir Notion/Confluence varsa bunu şimdiden yapıyor; sadece böyle organizasyonlar çok az
“Muğlaklık tespiti”ni reinforcement learning ile geliştirmek, performans algoritmalarını reinforcement learning ile geliştirmekten daha zor olacaktır, ama imkânsız değil ve bence zaten üzerinde çalışılıyor. Artık mesele zaman
Daha niş algoritmaları sıfırdan icat etmede zayıflar ve saçma derecede kısa vadeli kestirmeler eklemeye sıkça çalışıyorlar. Şimdilik bir araçlar, ama araçları ustalıkla kullanan bir zanaatkâr değiller. Bu zamanla değişecek ve nadir algoritmaların avantaj sağladığı alanlar da azalacak
Ortalama olarak hangisinin ağır basacağını kestirmek gerçekten zor
AI CEO'ları, AI'ın kanseri iyileştireceği üzerine uzun uzun konuşmayı seviyor ama böyle araştırma problemleri üzerinde gerçekten agresif biçimde çalışan tek yer sanki DeepMind
OpenAI ve Anthropic ise daha çok kurumsal gelir ile kodlama gelirinin peşinden gidiyor gibi görünüyor
Googler'lar, Claude Code ya da Codex yerine Gemini kodlama ajanı kullanmaktan memnun mu? Alay etmek için değil, gerçekten merak ediyorum
UI/UX/araçlar tarafında hâlâ toparlanan kısımlar, sürüm kontrol sistemi entegrasyonu ve hakkında konuşması zor daha derin problemler var; ama çoğu şikâyetin gerçek yetenekten çok değişim hızı ile ilgili olduğunu düşünüyorum
İlginç olan şu ki içeride etkili pek çok kişi Pro model yerine Flash modeli güçlü biçimde tercih ettiğini söylüyor. Bunun doğru olup olmamasından bağımsız olarak, artık “daha iyi” modelin mutlaka daha kullanışlı olmadığı; daha hızlı bir model ile daha iyi bir harness kombinasyonunun daha iyi bir denge sunabildiği bir aşamaya geldiğimizi görmek ilginç
Sürekli timeout, tuhaf hata modları ve mod değiştirmek için yeni sohbet başlatma zorunluluğu gibi sorunlar var. Yine de bu, Gemini modelinin kendisinden çok eklenti ile ilgili bir sorun gibi görünüyor
VS Code eklentisi tarafını bir kenara bırakıp gerçek problem çözmeye bakarsam, üç premier model de benim kullanımım için mükemmel kodlama ajanları
Gemini en iyi kodlama ajanı olmayabilir ama başka işlerde çok iyi olabilir
Araç çağırmayı tamamen unutup uzun süre vakit kaybediyor, sonra pes ediyor; ya da AGENTS.md benzeri dosyalardaki kod stili yönergelerini tamamen görmezden geliyor
Benim Gemma 4'ü yerelde çalıştırma deneyimim de benzerdi. Bir iki araç çağrısından sonra kafasına göre çağırmaya başlıyor. Daha dün
read_file(start, end)gibi bir aracıread_file(start, number_of_bytes)diye yeniden tanımlayıp, yanlış olabileceği ihtimalini bile kabul etmediğini gördümAI kendi kendine, ya da en azından üzerinde çalıştığı mimariyi iyileştiriyorsa, insanların dediği gibi tekillik yakın demektir
Sentetik veri üretimi veya model testi dışında, AI'ın LLM'leri iyileştirmek için kullanıldığı başka örnekler var mı?
Daha verimli bir transformer sadece çalıştırma maliyetini düşürür
“AI AI'ı iyileştiriyor” diyebilmek için, bir nesil AI'ın kendisinden temelde daha yetkin olan sonraki nesil AI'ı tasarlaması gerekir. Sadece daha hızlı ya da daha ucuz yapmak değil; sürüngen beyninin memeli beynini otonom biçimde tasarlaması gibi bir şey olmalı
AlphaEvolve gibi akıllı bir harness'e bağlı olsa bile, LLM'lerde böyle bir yaratıcılık olduğunu düşünmüyorum. Ancak bir sonraki nesil mimari, LLM'lerin tahmin etmeye yönlendirilebileceği bileşen kombinasyonları içinde apaçık gizliyse istisna olabilir
Daha olası yol, AGI'a doğru insan inovasyonunun birkaç adım daha ilerlemesinden sonra, prompt temelli kombinasyon üretimi değil otonom inovasyon yapabilen AI'ın ortaya çıkması
Tekilliği imkânsız kılacak kadar güçlü kısıtlar olabilir ya da zaman ufku o kadar uzun olabilir ki pratikte anlamlı olmaz
Tüm büyük AI laboratuvarları araştırma ajanları, özellikle de AI iyileştirmeye yönelik ajan projeleri üzerinde ciddi şekilde çalışıyor ve bu yıl bunların önemli kısmının deney aşamasını aşmasını bekliyorum
Gelecek yıl gerçekten çok iş yapacaklar ve AI'ın ortak mucidi olduğu ilk büyük, geçerli mimari değişimi göreceğimizi düşünüyorum
Erdős problemini daha kaç kez duymamız gerekecek :) İlk başta insanlığın muhteşem bir başarısı gibi geliyor ama zaman geçtikçe sürekli geri dönüyor
Bu arada Gemini CLI aylardır bozuk durumda
https://github.com/google-gemini/gemini-cli/issues/22141
Keşke Google, Gemini 3.x modellerini genel kullanıma sunmaya odaklansa ve 429 hatalarıyla sürekli boğuşmamak için yeterli kapasite sağlasa
Vertex API ile kurumsal müşteri uygulamaları geliştirmeyin deniyormuş gibi hissettiriyor. Özellikle belge analizi gibi alanlarda modelin gerçekten çok iyi olduğunu görünce bu daha da üzücü
Tüm *Evolve makalelerinin sonuçları çok etkileyici, ama kamuya açık bilgileri incelerken hissettiğim şey, ilginin LLM ve AI tarafına kayması
Oysa bildirilen başarılar neredeyse her zaman LLM ile evrimsel algoritmaların iyi çalışması için son derece iyi tasarlanmış ortamların ürünü
Bu makale bunun iyi bir örneği ve okumaya değer
Magellan: Autonomous Discovery of Novel Compiler Optimization Heuristics with AlphaEvolve
https://arxiv.org/abs/2601.21096
Algoritma iyileştirme için inanılmaz derecede basit bir çözüm. Aktivasyon mühendisliğiyle uğraştığım birkaç yıl önce bunun gibi bir şey olmasını isterdim: https://blog.n.ichol.ai/llm-activation-engineering-an-easy-f...
AlphaEvolve'a nasıl erişebiliriz?
Claude'da fark ettiğim sorun basit görevlerde bile kodu ve çıktıları gereğinden fazla şişirmesi, bazen de bunların hiç çalışmaması
Gemini ise çalışan çözümü, tam gerektiği kadar kod ve minimum karmaşıklıkla vererek yönetmesi daha kolay bir dengeyi oldukça iyi kuruyor
Bu günlerde Claude'u daha çok frontend kodu, özellikle de HTML için açıyorum. Orada bile CSS kodu fazla ve dosyanın yaklaşık %60'ını kaplıyor, ama biraz daha cilalı bir his verdiği için dosya boyutunun büyümesine katlanıyorum