1 puan yazan GN⁺ 2025-06-27 | 2 yorum | WhatsApp'ta paylaş
  • Google DeepMind, AlphaGenome adlı yeni bir DNA dizisi yapay zeka modelini tanıttı
  • Bu model, gen düzenleyici varyantların etkisini tahmin etmede hassasiyeti artırıyor ve çeşitli gen düzenleme süreçlerini öngörebiliyor
  • En fazla 1 milyon baz çifti uzunluğundaki DNA dizilerini girdi olarak alıp çeşitli biyolojik olayları yüksek çözünürlükte tahmin etmesiyle öne çıkıyor
  • Mevcut modellerden farklı olarak, çeşitli biyolojik doku ve hücre türleri için varyantların etkisini tek seferde değerlendirebiliyor
  • AlphaGenome'un, araştırmacıların gen işlevini ve hastalık biyolojisini anlamasına yardımcı olması ve yeni tedavilerin keşfini hızlandırması bekleniyor

AlphaGenome'a giriş

  • Google DeepMind, AlphaGenome adlı yeni bir DNA dizisi yapay zeka modelini tanıttı
  • Bu model, gen düzenlemesini etkileyen tekil varyant ya da mutasyonların etkisini hassas biçimde tahmin ederek genom işlevi araştırmaları ve hastalıkların anlaşılması açısından önemli bir dönüm noktası sunuyor
  • Araştırma amacıyla API üzerinden önceden erişilebiliyor; modelin ileride daha geniş biçimde sunulması planlanıyor

AlphaGenome nasıl çalışıyor

  • AlphaGenome, en fazla 1 milyon baz çifti uzunluğunda DNA dizilerini girdi olarak alıp çeşitli moleküler özellikleri tahmin ediyor
  • Tahmin edilebilen özellikler arasında gen konumu, RNA üretim miktarı, DNA erişilebilirliği, protein bağlanma bölgeleri gibi binlerce unsur yer alıyor
  • Model, ENCODE, GTEx, 4D Nucleome ve FANTOM5 gibi büyük ölçekli açık verilerle eğitildi
  • İç yapısında, kısa örüntüleri önce konvolüsyon katmanları ile algılıyor, ardından dizi genelindeki bilgileri transformer ile birleştirip çeşitli tahminler üretiyor
  • Dağıtık TPU ortamında büyük hacimli hesaplamaları işleyerek eğitim verimliliğini artırıyor
  • Önceki Enformer modelinin ilerisine geçerek, yalnızca protein kodlayan bölgelere odaklanan AlphaMissense'in aksine kodlamayan bölgeleri de (tüm genomun %98'i) kapsamlı biçimde analiz ediyor

AlphaGenome'un fark yaratan yönleri

  • Ultra yüksek çözünürlükte, uzun menzilli dizi analizi: 1 milyon baz çifti ölçeğinde analiz yapıyor ve tek baz düzeyinde hassasiyetle sonuç veriyor
  • Mevcut modellere göre eğitim verimliliği daha yüksek; daha az kaynakla daha hızlı eğitilebiliyor
  • Entegre çok modlu tahmin: Gen düzenlemesinin farklı aşamalarındaki bilgileri tek modelde eşzamanlı tahmin ediyor
  • Verimli varyant puanlama: Mutasyona uğramış dizi ile normal diziyi anında karşılaştırarak farklı biyolojik olaylar üzerindeki varyant etkisini hızlıca hesaplıyor
  • Yenilikçi splicing bağlantı bölgesi modellemesi: Gen splicing konumlarını ve ifade düzeylerini doğrudan tahmin ederek nadir hastalık araştırmalarına da katkı sağlıyor

İleri düzey performans ve benchmark sonuçları

  • AlphaGenome, 24 genom tahmin benchmark'ının 22'sinde ve 26 varyant düzenleyici etki değerlendirmesinin 24'ünde harici en iyi modelleri geride bıraktı ya da onlarla eşdeğer performans gösterdi
  • Belirli görevlere özel modellerin aksine, farklı biyolojik özellik türlerini tek bir API çağrısıyla aynı anda tahmin edebilen tek model olarak öne çıkıyor

Entegre modelin avantajları

  • Birden çok modaliteyi bütünleşik biçimde ele alabildiği için bilim insanlarının farklı hipotezleri ve deneyleri hızla yinelemesine olanak tanıyor
  • DNA dizisinin genel temsillerini öğrendiği için topluluğun ek eğitim ve optimizasyon yapmasını kolaylaştırıyor
  • Veri ya da uygulama kapsamı eklenerek genişletilebilen esneklik ve ölçeklenebilirlik sunuyor

Güçlü bir araştırma aracı olarak anlamı

  • Hastalıkları anlama: Nadir varyantlar gibi hastalık nedenlerinin aydınlatılmasında ve tedavi hedeflerinin keşfinde kullanılma potansiyeline sahip
  • Sentetik biyoloji: Belirli işlevlere sahip sentetik DNA tasarımında kullanılabilir
  • Temel araştırma: Genomun temel işlevsel öğelerinin haritalanmasını ve hücre bazında düzenleyici öğelerin bulunmasını destekler
  • Nitekim AlphaGenome, T-ALL (akut lenfoblastik lösemi) ile ilişkili bir varyantın MYB DNA bağlanma motifi oluşturup yakındaki TAL1 geninin etkinleşmesine yol açtığını tahmin ederek, söz konusu varyantın hastalık genini nasıl etkilediğine dair mekanizmayı başarıyla yeniden üretti

Mevcut sınırlamalar

  • 100 bin bazdan daha uzakta bulunan çok uzak düzenleyici öğelerin etkisini belirlemek hâlâ zorlu bir problem
  • Hücre ve dokuya özgü örüntülerin tanınması için de ek araştırma gerekiyor
  • Bireysel genom tahmini (kişiselleştirilmiş tanı ve öngörü) amacıyla şu anda düşünülmüyor
  • Yalnızca moleküler düzeyde tahmin yapabiliyor; tüm hastalıkların karmaşık nedenlerini tamamen açıklayamıyor
  • Şu an araştırma amaçlı duyuru aşamasında; doğrudan klinik uygunluk değerlendirmesi ya da tedavi uygulaması henüz mümkün değil

Topluluk desteği ve bundan sonraki yön

  • API, ticari olmayan araştırma amacıyla hemen kullanılabiliyor ve araştırma topluluğuyla geniş kapsamlı iş birliği sayesinde AlphaGenome'un kullanım alanının artırılması planlanıyor
  • Topluluk forumları gibi kanallar üzerinden geri bildirim ve kullanım örnekleri toplanıyor
  • Daha fazla veri, tür ve modalite eklenmiş genişletilmiş sürümlere evrilmesi bekleniyor
  • Genom yorumlamasıyla ilgili yeni tıp ve yaşam bilimleri araştırmalarında yeniliği hızlandırması umuluyor

Sonuç

  • AlphaGenome, genetik varyasyonların anlamını aynı anda farklı açılardan yorumlayabilen ve temel ile klinik araştırmaları hızlandırabilecek yeni bir yapay zeka tabanlı genom analiz aracı
  • Dış uzman topluluklarıyla iş birliği yaparak genom verisi tabanlı yenilikleri mümkün olduğunca çok kişiye yayma planı bulunuyor

2 yorum

 
galadbran 2025-06-27

Gen tahminleriyle ilgilenen bir yapay zeka modelindeki multimodalitenin hangi modalitelerden oluştuğunu merak edip o3'e sordum; bana transkripsiyon miktarı, transkripsiyon başlangıç ve bitiş konumları, splicing gibi şeylerin modalite sayıldığını söyledi.

 
GN⁺ 2025-06-27
Hacker News görüşleri
  • Kurumsal baskının arttığına dair bir işaret olarak, tek bir A100 üzerinde çalıştırılabilecek bir model olmasına rağmen ne kodun ne de parametrelerin paylaşılmaması, yalnızca bir API’nin arkasında çalıştırılması ve makalenin 31. sayfasına tüm modelin sözde kod olarak yapıştırılmış olması dikkat çekiyor; Google/Demis/Sergei’den bari parametreleri paylaşmaları isteniyor. Bu kadar küçük bir model yalnızca API arkasında kaldığında kanseri bile tedavi edemez gibi görünüyor ve GCloud gelirine de büyük katkı sağlamayacağı düşünülüyor

  • Hücre simülasyonu alanında bir atılım yaşanırsa, moleküler dinamik kadar kullanışlı ama modern süper bilgisayarlarda uygulanabilir bir simülasyonun mümkün olması bekleniyor; yaşam bilimleri araştırmalarındaki en büyük engellerden birinin içeride neler olduğunu görememek olduğu düşünülüyor

    • Arc bu işe gerçekten girişmiş durumda; ayrıntılar için arcinstitute.org’daki ilgili haber incelenebilir
    • Bunun kuantum hesaplama tarafından çözülebileceği düşünülüyor, ancak bunun için muhtemelen daha 10 yıl var; yapay zeka hızlandırmasının etkisini öngörmek zor
    • Gerçek anlamda deterministik simülasyonlar üretmeye dönük daha fazla çaba olması isteniyor; sadece sonuç veren kara kutular yerine iç süreci ortaya koyan yaklaşımların daha önemli olduğu düşünülüyor
  • Yüksek etkili yapay zeka uygulama araştırmalarını yalnızca DeepMind yapmıyor, ancak bu alanda neden bu kadar belirgin biçimde öne çıktığı merak ediliyor; bunun güçlü teknoloji pazarlamasından mı yoksa başka bir nedenden mi kaynaklandığı soruluyor

    • Bu makalenin iyi hazırlanmış bir çalışma olduğu, ancak çığır açıcı bir yenilik gibi görünmediği ve benzer girişimlerin uzun süredir sürdüğü görüşü var
    • DeepMind bunu uzun zamandır yapıyor ve Google’ın sağladığı devasa kaynaklar bunu destekliyor; perplexity’ye göre AlphaFold 2 veritabanını kurmak için “milyonlarca GPU saati” harcanmış
    • Yaşam bilimlerinde Arc Institute çok taze çalışmalar yürütüyor; ilaç şirketleri arasında ise Genentech veya GSK’nin yapay zeka gruplarının çok iyi işler çıkardığı söyleniyor
    • Google bünyesindeki bir organizasyon olduğu için, 2 trilyon dolarlık bir şirketin desteğinin yalnızca pazarlamadan ibaret olmayan avantajlar getirdiği düşünülüyor
  • Girdi boyutunu insan genomu büyüklüğü olan 3.2Gbp’ye genişletmeyi hayal etmek ilginç; bunun ilginç etkileşimler ortaya çıkarabileceği düşünülüyor. U-net ve transformer’ın araştırmanın merkezi hâline gelmesi de ayrıca dikkat çekici

    • Aslında 2 megabazdan fazlasına gerek olmayabileceği düşünülüyor; çünkü genom tek bir kesintisiz dizi değil, kromozomlar ve topologically associated domain birimleri düzeyinde fiziksel olarak ayrılıp organize ediliyor. Yaklaşık 2 megabaz, cis regulatory element ile effector gene arasındaki temel etkileşimlerin neredeyse tamamını kapsıyor
    • “Her şeyin U-net ve transformer etrafında dönmesi ilginç” yorumuna karşılık, “elinde sadece çekiç olan insan” bakış açısından söz ediliyor
  • Şirket içinde genom verilerini kullanarak reklam verimliliğini artırmaya dönük fikirlerin de ortaya çıkabileceği tahmin ediliyor; örneğin kolon kanseri riski görülürse “kolon sağlığı takviyesi” reklamı göstermek ya da genetik bilgiyle eğilim analizi yapıp “bu gen siyah mizahı sevme eğilimiyle ilişkili, bu gene sahip kişilere yeni filmi tanıtalım” türü pazarlama stratejilerinin mümkün olabileceği öngörülüyor

  • RNA tahmin performansındaki büyük sıçramanın mRNA laboratuvarları için büyük bir fırsat yaratması bekleniyor

    • (Hemen ardından gelen yanıtta: bunun ABD dışındaki bölgelerde daha da belirgin olabileceği düşünülüyor)
  • 2008’de Google’a katıldıktan hemen sonra yaşam bilimlerine büyük yatırım yapılması gerektiğini savunduğunu, Google’ın veri işleme ve ML yetenekleriyle dünyada öncü sonuçlar üretip bu yöntemlerin diğer biyologlar tarafından da yeniden üretilebilmesine yardımcı olabileceğine inandığını söyleyen bir yorum var; gerçekten de exacycle ile protein katlanması/tasarımı alanında ilginç sonuçlar elde edildiği, ardından Cloud Genomics ile büyük veri kümelerini depolama ve analiz etme hizmetlerinin sunulduğu belirtiliyor. Sonuçta DeepMind, bu kişinin hayal ettiği hedefi çok daha etkileyici biçimde gerçekleştirmiş gibi görünüyor; son makalenin topluluğun sindirmesinin zaman alacağı kadar çok şey içerdiği söyleniyor

    • Sundar’ın Google CEO’su olarak ilham verici bir lider olmadığı değerlendirmesine katılındığı, ancak göreve gelmeden önce 2015’te çeyreklik 3B kârın 2025 1. çeyrekte 35B’ye çıkarak 10 kat büyümesine öncülük ettiği, reklam işine hâkimiyeti sayesinde bugünkü kârlılığı sağladığı düşünülüyor. Yapay zeka dönüşümünde biraz geç kalmış olsa da Gemini gibi ürünlerde rekabetçi olduğu, DeepMind’ın da olağanüstü işler çıkardığı ve “Sundar’ın hype’ı az ama performansı çok yüksek” olduğu yorumu yapılıyor
    • “Uzun süredir istediğim şeyin gerçekleşmesinden mutluyum” yorumunun epey kendini beğenmiş tınladığı, çoğu insanın da harika fikirleri olsa bile “nihayet, benim fikrim dünyaya geldi…” gibi konuşmasının kulağa tuhaf geldiği söyleniyor
    • Geçmişte Santa Cruz servisi yolculuğunda bu konuda konuşulup konuşulmadığı soruluyor; o zamanki sohbetin çok ilginç olduğu ve AlphaGenome ortaya çıktıktan sonra da heyecanın sürdüğü belirtiliyor
    • Mevcut bir Googler bakış açısından Sundar hakkındaki düşüncelerin oldukça karmaşık olduğu, yapay zeka alanında en baştan altyapı ve araçlara yatırım yapmasının takdir edildiği, ancak Demis’ten çok Jeff Dean’e daha fazla paye verilmesi gerektiği düşünülüyor
  • Makaledeki en büyük sorunlardan birinin, ilişki düzeyi yüksek DNA bölgeleri içinde gerçekten nedensel olan varyantlarla nedensel olmayan varyantları ayırt etme işini görmezden gelmesi olduğu belirtiliyor; buna genetikte fine mapping deniyor. Etkili ilaç hedefleri için kilit düzenleyici bölgeleri doğru biçimde daraltmak çok önemli. Yakın tarihli bir Nature makalesi, bu soruna dair bir örnek ve otoimmünitede makrofaj işlevini düzenlemeye yönelik aday ilaçlara kadar uzanan bir bağlantı sunuyor

    • Bunun bu tür bir yöne gerçekten yaklaştırıp yaklaştırmadığı merak ediliyor; derin uzmanlık olmadığı, ancak işlev tahmini iyileşirse gerçekten önemli varyantlarla anlamsız varyantları ayırt etmenin kolaylaşacağı düşünülüyor. Bir sonraki adımın, bunu sağlam istatistiksel fine mapping yöntemleriyle birleştirmek olacağı tahmin ediliyor