1 puan yazan GN⁺ 1 시간 전 | 1 yorum | WhatsApp'ta paylaş
  • AlphaEvolve, Gemini tabanlı bir kodlama ajanı; gelişmiş algoritma tasarımıyla başlayıp matematik ve bilgisayar bilimlerindeki açık problemlere, Google altyapısının optimizasyonuna ve bilimsel ile endüstriyel görevlere kadar uygulama alanını genişletiyor
  • Genomikte DeepConsensus'u geliştirerek varyant tespit hatalarını %30 azalttı; elektrik şebekelerinde ise AC Optimal Power Flow probleminin uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmaya katkı sağladı
  • Yer bilimlerinde Earth AI model optimizasyonunu otomatikleştirerek orman yangını, sel ve hortum dahil 20 doğal afet kategorisinde risk tahmininin genel doğruluğunu %5 artırdı; kuantum fiziğinde ise Willow quantum processor üzerinde mevcut temel ölçüte kıyasla hatası 10 kat daha düşük kuantum devreleri önerdi
  • Matematikte Terence Tao ile birlikte Erdős problemi'nin çözümüne katkı sundu; ayrıca Traveling Salesman Problem ve Ramsey Numbers için alt sınırları iyileştirmede, yorumlanabilir sinirbilim modellerinde, mikroekonomide, kriptografide, sentetik veride ve yapay zeka güvenliği önlemlerinde kullanıldı
  • Google altyapısında yeni nesil TPU tasarımı, cache replacement policy, Google Spanner'ın LSM-tree compaction heuristic'i ve derleyici optimizasyonlarında kullanıldı; ticari uygulamalarda ise Klarna’da eğitim hızını 2 katına çıkardı, FM Logistic’te rota verimliliğini %10,4 iyileştirdi, Schrödinger’de MLFF eğitim ve çıkarımını yaklaşık 4 kat hızlandırdı

Toplumsal etki ve sürdürülebilirlik

  • Genomik

    • AlphaEvolve, Google Research tarafından geliştirilen DNA dizileme hata düzeltme modeli DeepConsensus'u iyileştirmek için kullanıldı ve varyant tespit hatalarını %30 azalttı
    • Bu iyileştirme, PacBio bilim insanlarının genetik verileri daha doğru ve daha düşük maliyetle analiz etmesine yardımcı oluyor
    • PacBio’dan Aaron Wenger, AlphaEvolve ile bulunan çözümün dizileme ekipmanlarının doğruluğunu anlamlı biçimde artırdığını ve araştırmacıların daha yüksek kaliteli verilerle daha önce gizli kalmış hastalığa yol açan mutasyonları keşfedebileceğini söyledi
  • Elektrik şebekesi optimizasyonu

    • AlphaEvolve, AC Optimal Power Flow problem'e uygulandı
    • Eğitilmiş Graph Neural Network(GNN) modelinin bu problem için uygulanabilir çözüm bulma oranını %14’ten %88’in üzerine çıkarmasına katkı sağladı
    • Bu sonuç, elektrik şebekelerinde maliyeti yüksek son işleme aşamalarına duyulan ihtiyacı büyük ölçüde azaltıyor
  • Yer bilimleri

    • AlphaEvolve, karmaşık jeo-uzamsal verileri daha güvenilir ve uygulanabilir içgörülere dönüştürmek için kullanılıyor
    • Earth AI model optimizasyonunu otomatikleştirerek, orman yangını, sel ve hortum dahil 20 kategoriyi birleştiren doğal afet risk tahmininin genel doğruluğunu %5 artırdı

Araştırma cephesindeki ilerlemeler

Yapay zeka altyapısında iyileştirmeler

  • AlphaEvolve, pilot testlerin ötesine geçerek Google altyapısının temel bileşenlerinden biri haline geldi
  • Yeni nesil TPU tasarımlarını optimize etmek için düzenli bir araç olarak kullanılıyor
  • Daha verimli cache replacement policy keşfederek, daha önce insanların aylar süren yoğun emeğini gerektiren bir işi yalnızca iki günde başardı
  • Jeff Dean, AlphaEvolve’un yapay zeka yığınını çalıştıran donanımın en alt seviyelerini optimize etmeye başladığını ve sezgiye aykırı ama verimli devre tasarımları önererek bunların doğrudan yeni nesil TPU silikonuna entegre edildiğini söyledi
  • AlphaEvolve, Google Spanner'ın Log-Structured Merge-tree compaction heuristic'ini iyileştirerek verimliliği artırdı
  • Bu optimizasyon, başlangıçtaki isteğe kıyasla depolamaya yazılan veri oranı olan yazma yükseltmesini (write amplification) %20 azalttı
  • AlphaEvolve ayrıca yazılımın depolama alanı kullanımını neredeyse %9 azaltan yeni bir derleyici optimizasyon stratejisine dair içgörüler de sağladı

Ticari uygulamaların genişlemesi

  • Google Cloud ile birlikte AlphaEvolve, çeşitli sektörlerdeki ticari şirketlere sunuluyor
  • Finansal hizmetlerde Klarna, AlphaEvolve’u kullanarak büyük transformer modellerinden birini optimize etti ve model kalitesini artırırken eğitim hızını 2 katına çıkardı
  • Yarı iletken üretiminde Substrate, AlphaEvolve’u hesaplamalı litografi çerçevesine uygulayarak çalışma süresini birkaç kat hızlandırdı ve daha büyük ölçekli gelişmiş yarı iletken simülasyonlarının çalıştırılmasını mümkün kıldı
  • Lojistikte FM Logistic, Traveling Salesman Problem gibi karmaşık rota problemlerini optimize ederek, hâlihazırda güçlü biçimde optimize edilmiş çözümlere kıyasla rota verimliliğini %10,4 iyileştirdi ve yılda 15.000 km’den fazla mesafe tasarrufu sağladı
  • Reklam ve pazarlamada WPP, AlphaEvolve ile yapay zeka model bileşenlerini rafine etti ve karmaşık yüksek boyutlu kampanya verileri üzerinde çalışarak rekabetçi manuel model optimizasyonuna kıyasla doğruluğu %10 artırdı
  • Hesaplamalı malzeme ve yaşam bilimlerinde Schrödinger, AlphaEvolve’u uygulayarak Machine Learned Force Fields(MLFF) eğitiminde ve çıkarımında yaklaşık 4 kat hızlanma elde etti
  • Schrödinger’den Gabriel Marques, daha hızlı MLFF çıkarımının ilaç keşfi, katalizör tasarımı ve malzeme geliştirmedeki Ar-Ge döngülerini kısaltarak şirketlerin molekül adaylarını aylar yerine günler içinde elemesine olanak tanıdığını ve bunun somut ticari etki yarattığını söyledi

Gelecek yönü

  • Son 1 yılda AlphaEvolve, çok amaçlı genel bir sistem olarak hızla konum kazandı
  • Bir sonraki büyük atılımın kendi kendine öğrenebilen, evrilebilen ve optimize olabilen algoritmalar tarafından yönlendirilebileceğini gösteriyor
  • Google DeepMind, AlphaEvolve’un yeteneklerini genişletmeyi ve onu daha geniş dış problemlere uygulamayı hedefliyor

1 yorum

 
GN⁺ 1 시간 전
Hacker News yorumları
  • Antirez'in "Don't fall into the anti-AI hype" [0] yazısını hatırlatıyor
    Tek cümlelik özeti şu: Bu tür temel modeller, “matris çarpımını daha hızlı yap” gibi çok yüksek seviyeli ama aynı zamanda çok iyi tanımlanmış problem alanlarını optimize etmede gerçekten çok güçlü. Antirez'in durumunda bu, “Redis'i daha hızlı yap” idi
    Tepkiler “benim işimde asla işe yaramaz” ile “aylar sürecek işi bir saatte bitirdi” arasında bölündü ve bence ikisi de doğru. Antirez'in sonrasında da sonuç almaya devam etmesi sevindirici [1], ama çoğu insanın yaptığı, örtük bilginin bol olduğu, insan sistemleri merkezli ve muğlak tanımlanmış işler LLM'lerin zorlandığı işler olabilir ya da baştan beri bunun için tasarlanmamış da olabilir diye düşünüyorum
    [0] https://antirez.com/news/158
    [1] https://antirez.com/news/164

    • Açıkçası artık buna öyle bakmıyorum. Modeller muğlaklığı oldukça iyi ele almaya başladı ve Claude Code artık belirsiz bir nokta varsa bana soru soruyor
      Yakında tüm toplantılar kaydedilip yazıya dökülecek ve ajanların muğlaklıkla karşılaştığında arayabileceği, iyi indekslenmiş bir yerde tutulacak. Şu anda bana sorabiliyorsa, böyle bir ortam kurulduğunda cevabı kendisi de arayıp bulabilir. Aslında iyi dokümante edilmiş bir Notion/Confluence varsa bunu şimdiden yapıyor; sadece böyle organizasyonlar çok az
      “Muğlaklık tespiti”ni reinforcement learning ile geliştirmek, performans algoritmalarını reinforcement learning ile geliştirmekten daha zor olacaktır, ama imkânsız değil ve bence zaten üzerinde çalışılıyor. Artık mesele zaman
    • Claude ve benzerleri, aklımdaki algoritmayı hızlıca uygulamada benim için epey iyiydi. Yine de çok sayıda kontrol sorusu sormak ve kodu gözden geçirmek gerekiyor
      Daha niş algoritmaları sıfırdan icat etmede zayıflar ve saçma derecede kısa vadeli kestirmeler eklemeye sıkça çalışıyorlar. Şimdilik bir araçlar, ama araçları ustalıkla kullanan bir zanaatkâr değiller. Bu zamanla değişecek ve nadir algoritmaların avantaj sağladığı alanlar da azalacak
    • Sonuçta belirleyici etken şu iki şeyden biri gibi görünüyor: “vay canına, verimliliği %1 artırdı” ya da “saçma sapan bir hallüsinasyon API'sini debug etmeye bir saat harcadım”
      Ortalama olarak hangisinin ağır basacağını kestirmek gerçekten zor
    • Ya AI destekli araştırma, AI'ı LLM'in ötesine taşıyacaksa? Bunun olamayacağını mı düşünüyorsun?
    • “LLM'ler örtük bilginin bol olduğu, insan sistemleri merkezli ve muğlak tanımlanmış işleri yapamaz” sözü 2030 civarında çok miyop bir görüş gibi görünebilir
  • AI CEO'ları, AI'ın kanseri iyileştireceği üzerine uzun uzun konuşmayı seviyor ama böyle araştırma problemleri üzerinde gerçekten agresif biçimde çalışan tek yer sanki DeepMind
    OpenAI ve Anthropic ise daha çok kurumsal gelir ile kodlama gelirinin peşinden gidiyor gibi görünüyor

    • Google bunu savaş kasasından kendi finanse edebilir ama OpenAI ve Anthropic yatırımcılara bağımlı
  • Googler'lar, Claude Code ya da Codex yerine Gemini kodlama ajanı kullanmaktan memnun mu? Alay etmek için değil, gerçekten merak ediyorum

    • Evet. Model iyi ve hızlı, iç araçlar da artık yetişti
      UI/UX/araçlar tarafında hâlâ toparlanan kısımlar, sürüm kontrol sistemi entegrasyonu ve hakkında konuşması zor daha derin problemler var; ama çoğu şikâyetin gerçek yetenekten çok değişim hızı ile ilgili olduğunu düşünüyorum
      İlginç olan şu ki içeride etkili pek çok kişi Pro model yerine Flash modeli güçlü biçimde tercih ettiğini söylüyor. Bunun doğru olup olmamasından bağımsız olarak, artık “daha iyi” modelin mutlaka daha kullanışlı olmadığı; daha hızlı bir model ile daha iyi bir harness kombinasyonunun daha iyi bir denge sunabildiği bir aşamaya geldiğimizi görmek ilginç
    • Gemini VS Code Extension'dan bahsediyorsan, Claude Code veya Codex'e kıyasla berbat. Bunun bu halde nasıl kullanıldığını anlamıyorum
      Sürekli timeout, tuhaf hata modları ve mod değiştirmek için yeni sohbet başlatma zorunluluğu gibi sorunlar var. Yine de bu, Gemini modelinin kendisinden çok eklenti ile ilgili bir sorun gibi görünüyor
      VS Code eklentisi tarafını bir kenara bırakıp gerçek problem çözmeye bakarsam, üç premier model de benim kullanımım için mükemmel kodlama ajanları
    • Kodlama, Gemini'nin ya da bu tür modellerin tek kullanım alanı değil. Bu yazının konusu da kodlama değil
      Gemini en iyi kodlama ajanı olmayabilir ama başka işlerde çok iyi olabilir
    • Geçen ay Steve Yegge bunun tersini ima etti: https://xcancel.com/Steve_Yegge/status/2043747998740689171
    • Google'daki insanlarla konuşunca, çoğunun dahili Gemini ajanlarından memnun olmadığını ve son zamanlarda belirgin biçimde kötüleştiğini düşündüğünü görüyorum
      Araç çağırmayı tamamen unutup uzun süre vakit kaybediyor, sonra pes ediyor; ya da AGENTS.md benzeri dosyalardaki kod stili yönergelerini tamamen görmezden geliyor
      Benim Gemma 4'ü yerelde çalıştırma deneyimim de benzerdi. Bir iki araç çağrısından sonra kafasına göre çağırmaya başlıyor. Daha dün read_file(start, end) gibi bir aracı read_file(start, number_of_bytes) diye yeniden tanımlayıp, yanlış olabileceği ihtimalini bile kabul etmediğini gördüm
  • AI kendi kendine, ya da en azından üzerinde çalıştığı mimariyi iyileştiriyorsa, insanların dediği gibi tekillik yakın demektir
    Sentetik veri üretimi veya model testi dışında, AI'ın LLM'leri iyileştirmek için kullanıldığı başka örnekler var mı?

    • AI'ın kendini daha yetkin hale getirmesi ile AI eğitimi/çıkarımında kullanılan yazılımı optimize etmesi elma ile armut kadar farklı şeyler
      Daha verimli bir transformer sadece çalıştırma maliyetini düşürür
      “AI AI'ı iyileştiriyor” diyebilmek için, bir nesil AI'ın kendisinden temelde daha yetkin olan sonraki nesil AI'ı tasarlaması gerekir. Sadece daha hızlı ya da daha ucuz yapmak değil; sürüngen beyninin memeli beynini otonom biçimde tasarlaması gibi bir şey olmalı
      AlphaEvolve gibi akıllı bir harness'e bağlı olsa bile, LLM'lerde böyle bir yaratıcılık olduğunu düşünmüyorum. Ancak bir sonraki nesil mimari, LLM'lerin tahmin etmeye yönlendirilebileceği bileşen kombinasyonları içinde apaçık gizliyse istisna olabilir
      Daha olası yol, AGI'a doğru insan inovasyonunun birkaç adım daha ilerlemesinden sonra, prompt temelli kombinasyon üretimi değil otonom inovasyon yapabilen AI'ın ortaya çıkması
    • Var. Geçen yıl AlphaEvolve açıklandığında, önceki Gemini modeli bu nesil modellerin eğitiminde kullanılan kernel'leri iyileştirmek için kullanıldı ve eğitim çalıştırmasını %1 hızlandırdı. Büyük bir şey değil ama yine de bir başarı
    • Son dönemde en viral olan örnek sanırım https://github.com/karpathy/autoresearch
    • Öz-iyileştirme ille de tekillik anlamına gelmez, değil mi?
      Tekilliği imkânsız kılacak kadar güçlü kısıtlar olabilir ya da zaman ufku o kadar uzun olabilir ki pratikte anlamlı olmaz
    • “AI'ın kendini iyileştirmesi” bence özellikle 2027'de bakılması gereken eşik
      Tüm büyük AI laboratuvarları araştırma ajanları, özellikle de AI iyileştirmeye yönelik ajan projeleri üzerinde ciddi şekilde çalışıyor ve bu yıl bunların önemli kısmının deney aşamasını aşmasını bekliyorum
      Gelecek yıl gerçekten çok iş yapacaklar ve AI'ın ortak mucidi olduğu ilk büyük, geçerli mimari değişimi göreceğimizi düşünüyorum
  • Erdős problemini daha kaç kez duymamız gerekecek :) İlk başta insanlığın muhteşem bir başarısı gibi geliyor ama zaman geçtikçe sürekli geri dönüyor

    • Hâlâ açık olan yalnızca yaklaşık 700 Erdős problemi kaldı; hepsi çözülünce nihayet rahat edeceğiz
  • Bu arada Gemini CLI aylardır bozuk durumda
    https://github.com/google-gemini/gemini-cli/issues/22141

  • Keşke Google, Gemini 3.x modellerini genel kullanıma sunmaya odaklansa ve 429 hatalarıyla sürekli boğuşmamak için yeterli kapasite sağlasa
    Vertex API ile kurumsal müşteri uygulamaları geliştirmeyin deniyormuş gibi hissettiriyor. Özellikle belge analizi gibi alanlarda modelin gerçekten çok iyi olduğunu görünce bu daha da üzücü

    • Bunu ücretsiz planda mı yapıyorsun? Ücretsiz planda 429 hatalarını çok daha fazla gördüm
  • Tüm *Evolve makalelerinin sonuçları çok etkileyici, ama kamuya açık bilgileri incelerken hissettiğim şey, ilginin LLM ve AI tarafına kayması
    Oysa bildirilen başarılar neredeyse her zaman LLM ile evrimsel algoritmaların iyi çalışması için son derece iyi tasarlanmış ortamların ürünü
    Bu makale bunun iyi bir örneği ve okumaya değer
    Magellan: Autonomous Discovery of Novel Compiler Optimization Heuristics with AlphaEvolve
    https://arxiv.org/abs/2601.21096

  • Algoritma iyileştirme için inanılmaz derecede basit bir çözüm. Aktivasyon mühendisliğiyle uğraştığım birkaç yıl önce bunun gibi bir şey olmasını isterdim: https://blog.n.ichol.ai/llm-activation-engineering-an-easy-f...
    AlphaEvolve'a nasıl erişebiliriz?

    • Bu sadece gösteriş amaçlı bir yazı. Ya 1 milyar dolarlık şirket ol ya da çık git demek istiyorlar
  • Claude'da fark ettiğim sorun basit görevlerde bile kodu ve çıktıları gereğinden fazla şişirmesi, bazen de bunların hiç çalışmaması
    Gemini ise çalışan çözümü, tam gerektiği kadar kod ve minimum karmaşıklıkla vererek yönetmesi daha kolay bir dengeyi oldukça iyi kuruyor
    Bu günlerde Claude'u daha çok frontend kodu, özellikle de HTML için açıyorum. Orada bile CSS kodu fazla ve dosyanın yaklaşık %60'ını kaplıyor, ama biraz daha cilalı bir his verdiği için dosya boyutunun büyümesine katlanıyorum