xLSTMTime: Long-term Time Series Forecasting With xLSTM
- Son yıllarda Transformer tabanlı modeller, çok değişkenli uzun vadeli zaman serisi tahmini (LTSF) alanında dikkat çekici başarılar gösterdi. Ancak yüksek hesaplama gereksinimi, zamansal dinamikleri yakalamadaki zorluklar ve uzun bağımlılıkları yönetme gibi sorunlarla karşı karşıya kalıyorlar
- Basit doğrusal yapıya sahip LTSF-Linear'ın ortaya çıkması, Transformer tabanlı modelleri geride bırakan sonuçlar ortaya koydu ve bu da zaman serisi tahmininde Transformer'ların faydasını yeniden değerlendirmeye yol açtı
- Buna karşılık bu makale, yakın dönemde ortaya çıkan bir mimari olan genişletilmiş LSTM'yi (xLSTM) LTSF'ye uygulamanın sonuçlarını sunuyor. xLSTM, üstel gating ve daha yüksek kapasiteli değiştirilmiş bellek yapısı sayesinde LTSF için uygun bir potansiyel taşıyor
- Benimsediğimiz LTSF mimarisi xLSTMTime, mevcut yaklaşımları geride bırakıyor. Çeşitli gerçek dünya veri kümelerinde çok sayıda güncel model ile xLSTMTime'ın performansını karşılaştıran sonuçlar, üstün tahmin yeteneğini ortaya koyuyor
- Bulgularımız, iyileştirilmiş yinelemeli mimarilerin LTSF görevlerinde Transformer tabanlı modellere karşı rekabetçi bir alternatif sunabileceğini ve zaman serisi tahmini alanının çehresini yeniden tanımlama potansiyeli taşıdığını gösteriyor
GN⁺ özeti
- Bu makale, Transformer tabanlı modellerin sınırlamalarını aşmak amacıyla xLSTM'yi kullanarak uzun vadeli zaman serisi tahmininde üstün performans sergiliyor
- xLSTMTime, üstel gating ve değiştirilmiş bellek yapısı sayesinde mevcut modelleri aşan tahmin yeteneğini ortaya koyuyor
- Bu çalışma, zaman serisi tahmininde yinelemeli mimarilerin potansiyelini yeniden gündeme getirirken Transformer tabanlı modellere yeni bir alternatif sunuyor
- Benzer işlevlere sahip projeler arasında Facebook'un Prophet'i ve Amazon'un DeepAR'ı bulunuyor
1 yorum
Hacker News görüşleri
Son birkaç yılda transformer tabanlı modellerin çok değişkenli uzun dönem zaman serisi tahmininde ilgi gördüğü doğru, ancak derin öğrenme dışı modellerden genel olarak daha iyi olup olmadıkları şüpheli
Benim anladığım kadarıyla öyle değildi, ama bu alanı çok yakından takip etmiyorum
Derin öğrenme modelleri mevsimselliği öğrenmede güçlü, ancak karmaşık trendleri ya da şokları ele almada pek iyi değiller
Ekonomi ve finans verilerinde mevsimsellik çoğu zaman basit, trendler ise karmaşık oluyor; bu yüzden derin öğrenme epey zayıf kalıyor gibi görünüyor
Bu makaleye katılıyorum. Kullandığım iyi derin öğrenme zaman serisi mimarileri, DeepAR ya da N-BEATS gibi, MLP veya tekrarlayan sinir ağlarının basit uzantılarına daha yakındı; transformer tabanlı mimariler ise, özellikle bugünlerde akın akın çıkan transformer tabanlı foundation model'lar da dahil olmak üzere, gerçekten berbattı
Ancak derin öğrenme modellerinin kendi arasında da transformer, çift yönlü LSTM, sıradan MLP, VAE vb. arasında performans farkı çok büyüktü
Ona göre transformer tabanlı mimariler, ağaç modellerine kıyasla görece daha az çabayla zaman serisi görevlerinde fena olmayan performans verebiliyor
Benim anladığım kadarıyla parametreleri yeterince ayarlarsanız ağaç tabanlı modeller genelde transformer'ları yenebilir. Ama TimeGPT gibi modeller kapsamlı ayarlama olmadan da makul performans verdiği için hızlı uygulama açısından çekici
İşimin bir kısmı gerçekten ekonomi tarafında nowcasting ve tahmin modelleri yapmak. Enflasyon, GSYİH gibi ekonomik göstergelerle piyasa likiditesi gibi finansal göstergelerle uğraşıyorum
Makaleyi henüz okuyamadım ama “transformer'lar iyi oldukları işlerde harika, ancak LSTM ailesi modeller hâlâ çok değerli” şeklindeki genel tona tamamen katılıyorum
Bunun Google'ın yapay zeka tabanlı hava tahmin modeliyle nasıl bir ilişkisi var?
https://deepmind.google/discover/blog/graphcast-ai-model-for...
Bu arada Graphcast, en azından büyük ölçekli küresel desen tahminlerinde tüm geleneksel küresel deterministik tahminleri geride bırakıyor. Bu da Z500 gibi metriklerde kabaca 3 ila 10 günlük gecikme aralıkları için geçerli
ECMWF'de Graphcast türevi olan AIFS var ve birkaç yıl içinde bunun ya da benzer bir şeyin operasyonel ortama alınması oldukça olası
Eğer bu bir tahmin aracı olarak pazarlanıyorsa, zaman serisindeki olay sınıflandırması için geçerli değil mi?
Makaledeki veri kümesi bağlantısının çalışmaması üzücü. Düzeltilse iyi olur
En iyi derin öğrenme zaman serisi modelleri muhtemelen hedge fonların içinde, kamuya kapalı durumdadır
Hedge fonlarda iyi çalışan yöntemler bile veri miktarı ve verinin doğası farklı olduğunda, gerekli tümevarımsal önyargıların az olduğu ya da farklı olduğu alanlarda kötü olabilir
Zaman serisi tahmini en iyi deterministik alanlarda çalışır
Açık LLM, AI, derin öğrenme, makine öğrenmesi tekniklerinden hiçbiri borsada işe yaramıyor. Gerçekten hiçbiri. Hepsini denedim
Birinin zaman serisi tahmin yöntemi gerçekten işe yarasaydı, bunu paylaşmazdı
Bunu XSLT diye yanlış okudum
Birinin bununla hisse senedi tahmini yapmaya çalışıp tüm parasını kaybedeceği günü sabırsızlıkla bekliyorum