1 puan yazan GN⁺ 2024-09-17 | 1 yorum | WhatsApp'ta paylaş
  • Biz Jayesh, Cris ve Nikhil; Silurian ekibinin bir parçasıyız. Silurian, Dünya’yı simüle eden temel modeller geliştiriyor ve buna hava tahminiyle başlıyor. Son kasırga tahmin sonuçlarını burada görselleştirilmiş olarak inceleyebilirsiniz

  • Hava tahminini bir gün daha erken bilmenin değeri ne olurdu? Geleneksel tahmin sistemlerinde tahmin doğruluğu her 10 yılda yaklaşık bir gün artıyor. Ancak son birkaç yılda GPU’lar ve modern derin öğrenme teknikleri sayesinde bu hızlanıyor

  • 2022’den bu yana NVIDIA, Google DeepMind, Huawei ve Microsoft gibi şirketlerde hava durumu için derin öğrenme sistemleri üzerine yoğun araştırmalar yürütülüyor. Bu modeller, neredeyse hiç fizik bilgisi gömmeden yalnızca veriden tahmin yapmayı öğreniyor. Şaşırtıcı biçimde, bu yaklaşım geleneksel atmosfer fiziği simülasyonlarından daha iyi tahminler sunuyor

  • Jayesh ve Cris, sırasıyla Microsoft’un ClimaX ve Aurora projelerine liderlik ederken bu teknolojinin potansiyelini doğrudan deneyimledi. Onların geliştirdiği temel modeller, hava tahmininde altın standart kabul edilen ECMWF tahminlerini iyileştirdi; üstelik kullanılan eğitim verisi bunun çok küçük bir kısmıydı. Silurian’ın hedefi, bu modelleri olabildiğince ölçeklendirmek ve fiziksel tahminin sınırlarına kadar zorlamak. Nihai amaç ise enerji şebekeleri, tarım, lojistik, savunma ve hava durumundan etkilenen tüm altyapıları modellemek. Yani Dünya’yı simüle etmek

  • Bu yaz, GFT (Generative Forecasting Transformer) adlı 1.5B parametreli frontier bir model geliştirdik. Bu model, yaklaşık 11 km çözünürlükte 14 güne kadar küresel hava durumunu simüle ediyor. Tarihsel kayıtlarda aşırı hava olaylarına dair veri az olmasına rağmen GFT, 2024 kasırga rota tahminlerinde çok güçlü performans gösteriyor. Kasırga tahminlerimizi burada inceleyebilirsiniz. Bunu görselleştirmek için cambecc/earth adlı açık kaynak hava durumu görselleştirme aracını kullandık

  • HN’deki lansman için çok heyecanlıyız ve görüşlerinizi duymak istiyoruz

GN⁺ Özeti

  • Silurian, hava tahminiyle başlayarak Dünya’yı simüle eden temel modeller geliştiren bir şirket
  • Son yıllarda derin öğrenme teknolojilerindeki ilerleme sayesinde hava tahmini doğruluğu önemli ölçüde artıyor
  • Silurian’ın GFT modeli, aşırı hava olayları verisi sınırlı olmasına rağmen güçlü tahmin performansı gösteriyor
  • Bu teknoloji, enerji, tarım, lojistik gibi çeşitli altyapılarda uygulanma potansiyeline sahip
  • Benzer projeler arasında NVIDIA ve Google DeepMind’ın hava durumu derin öğrenme sistemleri bulunuyor

1 yorum

 
GN⁺ 2024-09-17
Hacker News yorumları
  • Tropikal siklonlar için ensemble tahmini yapılabilmesine sevindim

    • ML modelleri ile ECMWF'nin HRES modelinin karşılaştırılmasından hayal kırıklığına uğradım
    • HRES, ortalama havanın en iyi tahmini değil; mümkün hava durumlarının tek bir gerçekleşmesidir
    • NeuralGCM, WeatherBench liderlik tablosunda üst sıralarda yer alıyor
    • Modellerin performansını WeatherBench üzerinde karşılaştırmak isterim
  • İçine fizik gömülmemiş modeller, yalnızca verilerle daha iyi tahmin yapıyor

    • NLP'deki "Her dilbilimciyi kovduğunda performans artar" deyişi, fizikçiler için de geçerli gibi görünüyor
  • Silurian, Dünya'yı simüle eden bir temel model inşa ediyor

    • Başarılı olursa sırada başka neyi simüle etmek isteyeceklerini merak ediyorum
  • ClimaX'in ticari potansiyeli konusunda heyecanlıyım

    • Belirli sektörlerin ticari potansiyel hakkında iletişime geçip geçmediğini merak ediyorum (ör. doğal kaynak arama)
  • Kâr amacı gütmeyen bir kuruluş olarak arazi için benzer modeller geliştiriyorum

    • Arazi maskesini arazi embedding'i ile değiştirmeye yardımcı olmak isterim
    • Bu, bölgesel etkileri downscale etmede çok yardımcı olacaktır
  • Google'ın geçen yıl çıkardığı GraphCast ile karşılaştırıldığında bunun nasıl farklılaştığını merak ediyorum

  • Hava durumu modelleri kafamı karıştırıyor

    • ML yöntemlerinin fizik tabanlı simülasyonlardan sayısal olarak daha kararlı olup olmadığını merak ediyorum
    • Hesaplama gereksinimleri açısından nasıl karşılaştırıldıklarını merak ediyorum
    • Geçmişte modelleri FORTRAN'dan Verilog'a dönüştürme deneyimim oldu
  • Bu yaklaşımın öngörülemez depremlere uygulanıp uygulanmadığını merak ediyorum

  • Bu yaklaşım, "The Bitter Lesson" için başka bir örnek gibi görünüyor

  • Gelecekte başka neleri simüle edeceklerini merak ediyorum

    • San Francisco'da nesneleri doğal dille arayabileceğiniz bir demo geliştirdim
    • Clay embedding'lerini denedim ama CLIP ile fine-tune edilmiş OSM caption embedding'lerinden daha kötü performans gösterdi