AlphaEvolve: Etkisini Birçok Alana Yayan Gemini Tabanlı Kodlama Ajanı

(deepmind.google)

6 puan yazan GN⁺ 2026-05-10 | 1 yorum | WhatsApp'ta paylaş

AlphaEvolve, Gemini tabanlı bir kodlama ajanı; gelişmiş algoritma tasarımıyla başlayıp matematik ve bilgisayar bilimlerindeki açık problemlere, Google altyapısının optimizasyonuna ve bilimsel ile endüstriyel görevlere kadar uygulama alanını genişletiyor
Genomikte DeepConsensus'u geliştirerek varyant tespit hatalarını %30 azalttı; elektrik şebekelerinde ise AC Optimal Power Flow probleminin uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmaya katkı sağladı
Yer bilimlerinde Earth AI model optimizasyonunu otomatikleştirerek orman yangını, sel ve hortum dahil 20 doğal afet kategorisinde risk tahmininin genel doğruluğunu %5 artırdı; kuantum fiziğinde ise Willow quantum processor üzerinde mevcut temel ölçüte kıyasla hatası 10 kat daha düşük kuantum devreleri önerdi
Matematikte Terence Tao ile birlikte Erdős problemi'nin çözümüne katkı sundu; ayrıca Traveling Salesman Problem ve Ramsey Numbers için alt sınırları iyileştirmede, yorumlanabilir sinirbilim modellerinde, mikroekonomide, kriptografide, sentetik veride ve yapay zeka güvenliği önlemlerinde kullanıldı
Google altyapısında yeni nesil TPU tasarımı, cache replacement policy, Google Spanner'ın LSM-tree compaction heuristic'i ve derleyici optimizasyonlarında kullanıldı; ticari uygulamalarda ise Klarna’da eğitim hızını 2 katına çıkardı, FM Logistic’te rota verimliliğini %10,4 iyileştirdi, Schrödinger’de MLFF eğitim ve çıkarımını yaklaşık 4 kat hızlandırdı

Toplumsal etki ve sürdürülebilirlik

Genomik
- AlphaEvolve, Google Research tarafından geliştirilen DNA dizileme hata düzeltme modeli DeepConsensus'u iyileştirmek için kullanıldı ve varyant tespit hatalarını %30 azalttı
- Bu iyileştirme, PacBio bilim insanlarının genetik verileri daha doğru ve daha düşük maliyetle analiz etmesine yardımcı oluyor
- PacBio’dan Aaron Wenger, AlphaEvolve ile bulunan çözümün dizileme ekipmanlarının doğruluğunu anlamlı biçimde artırdığını ve araştırmacıların daha yüksek kaliteli verilerle daha önce gizli kalmış hastalığa yol açan mutasyonları keşfedebileceğini söyledi
Elektrik şebekesi optimizasyonu
- AlphaEvolve, AC Optimal Power Flow problem'e uygulandı
- Eğitilmiş Graph Neural Network(GNN) modelinin bu problem için uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmasına katkı sağladı
- Bu sonuç, elektrik şebekelerinde maliyeti yüksek son işleme aşamalarına duyulan ihtiyacı büyük ölçüde azaltıyor
Yer bilimleri
- AlphaEvolve, karmaşık jeo-uzamsal verileri daha güvenilir ve uygulanabilir içgörülere dönüştürmek için kullanılıyor
- Earth AI model optimizasyonunu otomatikleştirerek, orman yangını, sel ve hortum dahil 20 kategoriyi birleştiren doğal afet risk tahmininin genel doğruluğunu %5 artırdı

Araştırma cephesindeki ilerlemeler

Kuantum fiziği
- AlphaEvolve optimizasyonu, Google’ın Willow quantum processor'unda karmaşık molekül simülasyonlarının çalıştırılmasını mümkün kılıyor
- Geleneksel optimizasyon temel ölçütlerine kıyasla hatası 10 kat daha düşük kuantum devreleri önererek, türünün ilk örneği olan kuantum hesaplama deney gösterimine doğrudan katkı sundu
- Bu başarı, AlphaEvolve’un klasik bilgisayarların kapasitesini aşan algoritmaları bulabileceği bir geleceğe işaret ediyor
Matematik
- AlphaEvolve, Terence Tao gibi matematikçilerle birlikte Erdős problemi'nin çözümüne katkı sundu
- Terence Tao, AlphaEvolve gibi araçların özellikle optimizasyon problemlerinde olası eşitsizlik karşı örneklerini hızlıca test etmeye veya uç değer nesnelerine dair inançları doğrulamaya yardımcı olarak sezgiyi ciddi biçimde geliştirdiğini ve katı kanıtların daha kolay bulunmasını sağladığını belirtti
- AlphaEvolve, Traveling Salesman Problem ve Ramsey Numbers gibi klasik matematik problemlerinin alt sınırlarını iyileştirerek yeni rekorlar kırdı
Diğer araştırma alanları
- AlphaEvolve’un otonom keşif yeteneği birçok alanda paralel yenilikleri tetikliyor
- Yorumlanabilir sinirbilim modeli keşfi, mikroekonomide yeni piyasa sınırı kanıtları ve sinir ağı bileşenleri alanlarındaki ilerlemelerde kullanıldı
- Ayrıca kullanıcı gizliliği için kriptografi, sentetik veri üretimi ve frontier yapay zeka modelleri için temel güvenlik önlemleri üzerinde de uygulandı
- AlphaEvolve’un “Tammes problem” örneklerini optimize ettiği bir örnek ile ek problemlere yönelik potansiyel çözümler, herkese açık Gallery içinde görülebilir

Yapay zeka altyapısında iyileştirmeler

AlphaEvolve, pilot testlerin ötesine geçerek Google altyapısının temel bileşenlerinden biri haline geldi
Yeni nesil TPU tasarımlarını optimize etmek için düzenli bir araç olarak kullanılıyor
Daha verimli cache replacement policy keşfederek, daha önce insanların aylar süren yoğun emeğini gerektiren bir işi yalnızca iki günde başardı
Jeff Dean, AlphaEvolve’un yapay zeka yığınını çalıştıran donanımın en alt seviyelerini optimize etmeye başladığını ve sezgiye aykırı ama verimli devre tasarımları önererek bunların doğrudan yeni nesil TPU silikonuna entegre edildiğini söyledi
AlphaEvolve, Google Spanner'ın Log-Structured Merge-tree compaction heuristic'ini iyileştirerek verimliliği artırdı
Bu optimizasyon, başlangıçtaki isteğe kıyasla depolamaya yazılan veri oranı olan yazma yükseltmesini (write amplification) %20 azalttı
AlphaEvolve ayrıca yazılımın depolama alanı kullanımını neredeyse %9 azaltan yeni bir derleyici optimizasyon stratejisine dair içgörüler de sağladı

Ticari uygulamaların genişlemesi

Google Cloud ile birlikte AlphaEvolve, çeşitli sektörlerdeki ticari şirketlere sunuluyor
Finansal hizmetlerde Klarna, AlphaEvolve’u kullanarak büyük transformer modellerinden birini optimize etti ve model kalitesini artırırken eğitim hızını 2 katına çıkardı
Yarı iletken üretiminde Substrate, AlphaEvolve’u hesaplamalı litografi çerçevesine uygulayarak çalışma süresini birkaç kat hızlandırdı ve daha büyük ölçekli gelişmiş yarı iletken simülasyonlarının çalıştırılmasını mümkün kıldı
Lojistikte FM Logistic, Traveling Salesman Problem gibi karmaşık rota problemlerini optimize ederek, hâlihazırda güçlü biçimde optimize edilmiş çözümlere kıyasla rota verimliliğini %10,4 iyileştirdi ve yılda 15.000 km’den fazla mesafe tasarrufu sağladı
Reklam ve pazarlamada WPP, AlphaEvolve ile yapay zeka model bileşenlerini rafine etti ve karmaşık yüksek boyutlu kampanya verileri üzerinde çalışarak rekabetçi manuel model optimizasyonuna kıyasla doğruluğu %10 artırdı
Hesaplamalı malzeme ve yaşam bilimlerinde Schrödinger, AlphaEvolve’u uygulayarak Machine Learned Force Fields(MLFF) eğitiminde ve çıkarımında yaklaşık 4 kat hızlanma elde etti
Schrödinger’den Gabriel Marques, daha hızlı MLFF çıkarımının ilaç keşfi, katalizör tasarımı ve malzeme geliştirmedeki Ar-Ge döngülerini kısaltarak şirketlerin molekül adaylarını aylar yerine günler içinde elemesine olanak tanıdığını ve bunun somut ticari etki yarattığını söyledi

Gelecek yönü

Son 1 yılda AlphaEvolve, çok amaçlı genel bir sistem olarak hızla konum kazandı
Bir sonraki büyük atılımın kendi kendine öğrenebilen, evrilebilen ve optimize olabilen algoritmalar tarafından yönlendirilebileceğini gösteriyor
Google DeepMind, AlphaEvolve’un yeteneklerini genişletmeyi ve onu daha geniş dış problemlere uygulamayı hedefliyor

1 yorum

GN⁺ 2026-05-10

Hacker News yorumları

Antirez'in "Don't fall into the anti-AI hype" [0] yazısını hatırlatıyor
Tek cümlelik özeti şu: Bu tür temel modeller, “matris çarpımını daha hızlı yap” gibi çok yüksek seviyeli ama aynı zamanda çok iyi tanımlanmış problem alanlarını optimize etmede gerçekten çok güçlü. Antirez'in durumunda bu, “Redis'i daha hızlı yap” idi
Tepkiler “benim işimde asla işe yaramaz” ile “aylar sürecek işi bir saatte bitirdi” arasında bölündü ve bence ikisi de doğru. Antirez'in sonrasında da sonuç almaya devam etmesi sevindirici [1], ama çoğu insanın yaptığı, örtük bilginin bol olduğu, insan sistemleri merkezli ve muğlak tanımlanmış işler LLM'lerin zorlandığı işler olabilir ya da baştan beri bunun için tasarlanmamış da olabilir diye düşünüyorum
[0] https://antirez.com/news/158
[1] https://antirez.com/news/164
- Açıkçası artık buna öyle bakmıyorum. Modeller muğlaklığı oldukça iyi ele almaya başladı ve Claude Code artık belirsiz bir nokta varsa bana soru soruyor
  Yakında tüm toplantılar kaydedilip yazıya dökülecek ve ajanların muğlaklıkla karşılaştığında arayabileceği, iyi indekslenmiş bir yerde tutulacak. Şu anda bana sorabiliyorsa, böyle bir ortam kurulduğunda cevabı kendisi de arayıp bulabilir. Aslında iyi dokümante edilmiş bir Notion/Confluence varsa bunu şimdiden yapıyor; sadece böyle organizasyonlar çok az
  “Muğlaklık tespiti”ni reinforcement learning ile geliştirmek, performans algoritmalarını reinforcement learning ile geliştirmekten daha zor olacaktır, ama imkânsız değil ve bence zaten üzerinde çalışılıyor. Artık mesele zaman
- Claude ve benzerleri, aklımdaki algoritmayı hızlıca uygulamada benim için epey iyiydi. Yine de çok sayıda kontrol sorusu sormak ve kodu gözden geçirmek gerekiyor
  Daha niş algoritmaları sıfırdan icat etmede zayıflar ve saçma derecede kısa vadeli kestirmeler eklemeye sıkça çalışıyorlar. Şimdilik bir araçlar, ama araçları ustalıkla kullanan bir zanaatkâr değiller. Bu zamanla değişecek ve nadir algoritmaların avantaj sağladığı alanlar da azalacak
- Sonuçta belirleyici etken şu iki şeyden biri gibi görünüyor: “vay canına, verimliliği %1 artırdı” ya da “saçma sapan bir hallüsinasyon API'sini debug etmeye bir saat harcadım”
  Ortalama olarak hangisinin ağır basacağını kestirmek gerçekten zor
- Ya AI destekli araştırma, AI'ı LLM'in ötesine taşıyacaksa? Bunun olamayacağını mı düşünüyorsun?
- “LLM'ler örtük bilginin bol olduğu, insan sistemleri merkezli ve muğlak tanımlanmış işleri yapamaz” sözü 2030 civarında çok miyop bir görüş gibi görünebilir
AI CEO'ları, AI'ın kanseri iyileştireceği üzerine uzun uzun konuşmayı seviyor ama böyle araştırma problemleri üzerinde gerçekten agresif biçimde çalışan tek yer sanki DeepMind
OpenAI ve Anthropic ise daha çok kurumsal gelir ile kodlama gelirinin peşinden gidiyor gibi görünüyor
- Google bunu savaş kasasından kendi finanse edebilir ama OpenAI ve Anthropic yatırımcılara bağımlı
Googler'lar, Claude Code ya da Codex yerine Gemini kodlama ajanı kullanmaktan memnun mu? Alay etmek için değil, gerçekten merak ediyorum
- Evet. Model iyi ve hızlı, iç araçlar da artık yetişti
  UI/UX/araçlar tarafında hâlâ toparlanan kısımlar, sürüm kontrol sistemi entegrasyonu ve hakkında konuşması zor daha derin problemler var; ama çoğu şikâyetin gerçek yetenekten çok değişim hızı ile ilgili olduğunu düşünüyorum
  İlginç olan şu ki içeride etkili pek çok kişi Pro model yerine Flash modeli güçlü biçimde tercih ettiğini söylüyor. Bunun doğru olup olmamasından bağımsız olarak, artık “daha iyi” modelin mutlaka daha kullanışlı olmadığı; daha hızlı bir model ile daha iyi bir harness kombinasyonunun daha iyi bir denge sunabildiği bir aşamaya geldiğimizi görmek ilginç
- Gemini VS Code Extension'dan bahsediyorsan, Claude Code veya Codex'e kıyasla berbat. Bunun bu halde nasıl kullanıldığını anlamıyorum
  Sürekli timeout, tuhaf hata modları ve mod değiştirmek için yeni sohbet başlatma zorunluluğu gibi sorunlar var. Yine de bu, Gemini modelinin kendisinden çok eklenti ile ilgili bir sorun gibi görünüyor
  VS Code eklentisi tarafını bir kenara bırakıp gerçek problem çözmeye bakarsam, üç premier model de benim kullanımım için mükemmel kodlama ajanları
- Kodlama, Gemini'nin ya da bu tür modellerin tek kullanım alanı değil. Bu yazının konusu da kodlama değil
  Gemini en iyi kodlama ajanı olmayabilir ama başka işlerde çok iyi olabilir
- Geçen ay Steve Yegge bunun tersini ima etti: https://xcancel.com/Steve_Yegge/status/2043747998740689171
- Google'daki insanlarla konuşunca, çoğunun dahili Gemini ajanlarından memnun olmadığını ve son zamanlarda belirgin biçimde kötüleştiğini düşündüğünü görüyorum
  Araç çağırmayı tamamen unutup uzun süre vakit kaybediyor, sonra pes ediyor; ya da AGENTS.md benzeri dosyalardaki kod stili yönergelerini tamamen görmezden geliyor
  Benim Gemma 4'ü yerelde çalıştırma deneyimim de benzerdi. Bir iki araç çağrısından sonra kafasına göre çağırmaya başlıyor. Daha dün read_file(start, end) gibi bir aracı read_file(start, number_of_bytes) diye yeniden tanımlayıp, yanlış olabileceği ihtimalini bile kabul etmediğini gördüm
AI kendi kendine, ya da en azından üzerinde çalıştığı mimariyi iyileştiriyorsa, insanların dediği gibi tekillik yakın demektir
Sentetik veri üretimi veya model testi dışında, AI'ın LLM'leri iyileştirmek için kullanıldığı başka örnekler var mı?
- AI'ın kendini daha yetkin hale getirmesi ile AI eğitimi/çıkarımında kullanılan yazılımı optimize etmesi elma ile armut kadar farklı şeyler
  Daha verimli bir transformer sadece çalıştırma maliyetini düşürür
  “AI AI'ı iyileştiriyor” diyebilmek için, bir nesil AI'ın kendisinden temelde daha yetkin olan sonraki nesil AI'ı tasarlaması gerekir. Sadece daha hızlı ya da daha ucuz yapmak değil; sürüngen beyninin memeli beynini otonom biçimde tasarlaması gibi bir şey olmalı
  AlphaEvolve gibi akıllı bir harness'e bağlı olsa bile, LLM'lerde böyle bir yaratıcılık olduğunu düşünmüyorum. Ancak bir sonraki nesil mimari, LLM'lerin tahmin etmeye yönlendirilebileceği bileşen kombinasyonları içinde apaçık gizliyse istisna olabilir
  Daha olası yol, AGI'a doğru insan inovasyonunun birkaç adım daha ilerlemesinden sonra, prompt temelli kombinasyon üretimi değil otonom inovasyon yapabilen AI'ın ortaya çıkması
- Var. Geçen yıl AlphaEvolve açıklandığında, önceki Gemini modeli bu nesil modellerin eğitiminde kullanılan kernel'leri iyileştirmek için kullanıldı ve eğitim çalıştırmasını %1 hızlandırdı. Büyük bir şey değil ama yine de bir başarı
- Son dönemde en viral olan örnek sanırım https://github.com/karpathy/autoresearch
- Öz-iyileştirme ille de tekillik anlamına gelmez, değil mi?
  Tekilliği imkânsız kılacak kadar güçlü kısıtlar olabilir ya da zaman ufku o kadar uzun olabilir ki pratikte anlamlı olmaz
- “AI'ın kendini iyileştirmesi” bence özellikle 2027'de bakılması gereken eşik
  Tüm büyük AI laboratuvarları araştırma ajanları, özellikle de AI iyileştirmeye yönelik ajan projeleri üzerinde ciddi şekilde çalışıyor ve bu yıl bunların önemli kısmının deney aşamasını aşmasını bekliyorum
  Gelecek yıl gerçekten çok iş yapacaklar ve AI'ın ortak mucidi olduğu ilk büyük, geçerli mimari değişimi göreceğimizi düşünüyorum
Erdős problemini daha kaç kez duymamız gerekecek :) İlk başta insanlığın muhteşem bir başarısı gibi geliyor ama zaman geçtikçe sürekli geri dönüyor
- Hâlâ açık olan yalnızca yaklaşık 700 Erdős problemi kaldı; hepsi çözülünce nihayet rahat edeceğiz
Bu arada Gemini CLI aylardır bozuk durumda
https://github.com/google-gemini/gemini-cli/issues/22141
Keşke Google, Gemini 3.x modellerini genel kullanıma sunmaya odaklansa ve 429 hatalarıyla sürekli boğuşmamak için yeterli kapasite sağlasa
Vertex API ile kurumsal müşteri uygulamaları geliştirmeyin deniyormuş gibi hissettiriyor. Özellikle belge analizi gibi alanlarda modelin gerçekten çok iyi olduğunu görünce bu daha da üzücü
- Bunu ücretsiz planda mı yapıyorsun? Ücretsiz planda 429 hatalarını çok daha fazla gördüm
Tüm *Evolve makalelerinin sonuçları çok etkileyici, ama kamuya açık bilgileri incelerken hissettiğim şey, ilginin LLM ve AI tarafına kayması
Oysa bildirilen başarılar neredeyse her zaman LLM ile evrimsel algoritmaların iyi çalışması için son derece iyi tasarlanmış ortamların ürünü
Bu makale bunun iyi bir örneği ve okumaya değer
Magellan: Autonomous Discovery of Novel Compiler Optimization Heuristics with AlphaEvolve
https://arxiv.org/abs/2601.21096
Algoritma iyileştirme için inanılmaz derecede basit bir çözüm. Aktivasyon mühendisliğiyle uğraştığım birkaç yıl önce bunun gibi bir şey olmasını isterdim: https://blog.n.ichol.ai/llm-activation-engineering-an-easy-f...
AlphaEvolve'a nasıl erişebiliriz?
- Bu sadece gösteriş amaçlı bir yazı. Ya 1 milyar dolarlık şirket ol ya da çık git demek istiyorlar
Claude'da fark ettiğim sorun basit görevlerde bile kodu ve çıktıları gereğinden fazla şişirmesi, bazen de bunların hiç çalışmaması
Gemini ise çalışan çözümü, tam gerektiği kadar kod ve minimum karmaşıklıkla vererek yönetmesi daha kolay bir dengeyi oldukça iyi kuruyor
Bu günlerde Claude'u daha çok frontend kodu, özellikle de HTML için açıyorum. Orada bile CSS kodu fazla ve dosyanın yaklaşık %60'ını kaplıyor, ama biraz daha cilalı bir his verdiği için dosya boyutunun büyümesine katlanıyorum

AlphaEvolve: Etkisini Birçok Alana Yayan Gemini Tabanlı Kodlama Ajanı

Toplumsal etki ve sürdürülebilirlik

Genomik

Elektrik şebekesi optimizasyonu

Yer bilimleri

Araştırma cephesindeki ilerlemeler

Kuantum fiziği

Matematik

Diğer araştırma alanları

Yapay zeka altyapısında iyileştirmeler

Ticari uygulamaların genişlemesi

Gelecek yönü

İlgili okumalar

1 yorum

Hacker News yorumları