7 puan yazan GN⁺ 28 일 전 | 1 yorum | WhatsApp'ta paylaş
  • TimesFM, Google Research tarafından geliştirilen zaman serisi tahmini için büyük ölçekli bir önceden eğitilmiş modeldir ve yalnızca decoder mimarisi kullanır
  • En güncel sürüm 2.5, 200 milyon parametre, 16k bağlam uzunluğu ve maksimum 1k horizon tahmini desteği sunar
  • Sürekli quantile tahmini, eşdeğişken girişi (XReg), Flax ve PyTorch backend'leri gibi çeşitli özellikler içerir
  • Model Hugging Face üzerinden yayımlanır ve BigQuery ile de entegre şekilde kullanılabilir
  • Zaman serisi verisi tahmini için genel amaçlı bir temel model olarak hem araştırma hem de pratik kullanımda ölçeklenebilirlik ve verimlilik sunar

TimesFM genel bakış

  • TimesFM (Time Series Foundation Model), Google Research tarafından geliştirilen zaman serisi tahmini için önceden eğitilmiş bir modeldir
  • ICML 2024 makalesi “A decoder-only foundation model for time-series forecasting” temel alınmıştır
  • Model checkpoint'leri Hugging Face koleksiyonu üzerinden sunulur ve BigQuery ile de resmi olarak entegredir
  • Açık sürüm resmi bir Google ürünü değildir

Model sürümleri ve başlıca güncellemeler

  • En güncel sürüm TimesFM 2.5'tir; önceki sürümler (1.0, 2.0) v1 dizininde saklanır ve timesfm==1.3.0 ile kurulabilir
  • 15 Eylül 2025 güncellemesi

    • TimesFM 2.5 modeli yayımlandı
    • Parametre sayısı 200M'e düşürüldü (önceki 500M'in yarısından da az)
    • Bağlam uzunluğu 16k'ye çıkarıldı (önceki 2048'den artırıldı)
    • Sürekli quantile tahmini (continuous quantile forecast), maksimum 1k horizon'a kadar desteklenir; isteğe bağlı 30M quantile head dahildir
    • frequency göstergesi kaldırıldı
    • Yeni forecasting flag'leri eklendi
    • Inference API yükseltildi
    • Gelecekte eklenmesi planlananlar
      1. Flax sürümü model desteği (daha hızlı çıkarım)
      2. Eşdeğişken (covariate) desteğinin geri getirilmesi
      3. docstring, dokümantasyon ve notebook'ların güçlendirilmesi
  • 29 Ekim 2025 güncellemesi

    • XReg üzerinden eşdeğişken (covariate) girişi desteği, TimesFM 2.5'e yeniden eklendi

Kurulum yöntemi

  • GitHub deposunu klonlayıp uv kullanarak sanal ortam oluşturma ve paket kurma
    • torch, flax, xreg arasından isteğe bağlı backend kurulabilir
    • İşletim sistemi ve hızlandırıcıya (CPU, GPU, TPU, Apple Silicon) göre PyTorch veya JAX (Flax) seçilebilir

Kod örneği

  • PyTorch tabanlı TimesFM 2.5 (200M parametre) modelini yükleme örneği verilir
    • timesfm.TimesFM_2p5_200M_torch.from_pretrained("google/timesfm-2.5-200m-pytorch") kullanılır
    • ForecastConfig ile girdi normalizasyonu (normalize_inputs), sürekli quantile head kullanımı, pozitiflik zorlama (infer_is_positive), quantile kesişimi düzeltme (fix_quantile_crossing) gibi ayarlar yapılabilir
    • forecast() çağrıldığında point forecast ve quantile forecast olmak üzere iki sonuç döner
      • point_forecast.shape: (2, 12)
      • quantile_forecast.shape: (2, 12, 10) — ortalama ile 10~90 quantile dahil

1 yorum

 
GN⁺ 28 일 전
Hacker News görüşleri
  • Genel bir zaman serisi modeli fikri biraz tuhaf geliyor
    Aynı modelin İtalya’daki yumurta fiyatlarını ve küresel enflasyonu aynı anda nasıl güvenilir biçimde tahmin edebildiği sorgulanıyor
    Üstelik tahminin gerekçesini açıklamıyorsa, sonucun güvenilmesinin zor olması da ayrı bir sorun gibi görünüyor

    • Aslında bu tür modeller yumurta fiyatını ya da enflasyonun kendisini tahmin etmiyor; zaman serisi verisini trend·mevsimsellik·artık bileşenlerine ayırıyor
      Orta Doğu’daki savaş gibi mevsimsel olmayan olayların enflasyonu etkilemesi modelin yakalayabileceği bir şey değil
    • Anladığım kadarıyla yapı, sentetik eğitim verisinin farklı alanlarda ortak görülen soyut zaman serisi örüntülerini yakalamaya yardımcı olması üzerine kurulu
      Makalenin ek 8. bölümüne göre, lineer trendler, ARMA, sinüs·kosinüs mevsimsel örüntüler gibi geleneksel istatistiksel modellerle sentetik veri üretilip eğitim yapılıyor
      Sonuçta bu bir Transformer mimarisi olduğu için, LLM’ler gibi giriş bağlamına göre probleme özgü örüntüleri buluyor
    • Google Ads’de çalışırken reklam kampanyalarının hedefe ulaşma olasılığını tahmin etmek için zaman serisi tahmini kullanmıştım
      Birçok reklamveren yalnızca mevcut değerlerden düz bir çizgi çekerek tahminde bulunuyordu ama haftanın günü·mevsimsellik etkilerini yansıtmadığı için bu yöntem isabetsizdi
      Buna karşılık zaman serisi modeli çok daha doğruydu ve tüm kampanya verisiyle eğitildiğinde %95 güven aralığı sağlayabiliyordu
    • Benford yasası(Benford’s law) da uygulanabilir
      İşaret ve üs yavaş değiştiği için bunlar tahmin edilir, anlamlı kısım ise Benford yasasıyla kestirilir
    • Yaklaşım olarak
      • ayrıştırma(decomposition): Fourier dönüşümünün genel biçimini bularak temel etkenleri ayırma
      • ezberleme(memorization): farklı alanlarda tekrar eden örüntüleri (ör. kuvvet yasası) öğrenme
      • çok görevli(multitask): hava durumu ve elektrik gibi alanlar arası ilişkilerden yararlanma
  • Başlığa (2024) eklenmesi iyi olabilir
    Zaten Google Research blogunda tanıtılmış bir içerik olduğu için yeni bir haber değil

    • Ama 2025 sonlarında büyük bir güncelleme olmuştu
  • İlgili blog yazısı GitHub’daki TimesFM sayfasında görülebilir

    • Muhtemelen şu Google Research blog yazısına bağlantı vermek istenmişti
    • Toplam GPU eğitim süresi merak ediliyor
      LLM’lere göre çok daha düşük görünüyor; bireysel araştırmacıların ya da üniversite laboratuvarlarının da eğitebileceği bir şey olup olmadığı bilinmek isteniyor
    • iOS Chrome’da gönderilen GitHub deposuyla aynı içerik açılıyor
  • Benzer projeler olarak Nixtla ve Prophet var

  • “Bunu ELI5 düzeyinde açıklayabilir misiniz? Ve kaç veri noktasını okuyabiliyor?” diye sorulmuş

  • Zaman serisinin bağlam olmadan yalnızca bir sayı kümesi olarak mı verildiği merak ediliyor
    Modelin veriye bakıp bunun hangi kategoriye ait olduğunu (hisse fiyatı, arama trendleri vb.) tahmin ettikten sonra buna uygun bir tahmin ürettiği düşünülüyor
    Ancak eğitim verisinde olmayan kategorilerde zayıf kalabilir gibi görünüyor
    Kişisel olarak ARIMA gibi basit modelleri ya da teori temelli modelleri tercih ettiğini söyleyenler var

    • Yine de LLM’lerin uzun token akışında bir sonraki token’ı tahmin etmesi gibi, bu model de çalışabilir
      Asıl mesele mimari ve eğitim biçiminin ne kadar genellenebilir olduğu
  • Bu model birkaç aydır açık durumdaydı; gerçekten bunun üzerine bir şey inşa eden örnekler olup olmadığı merak ediliyor

  • Geçmiş güneş ışınımı ve hava tahmini zaman serileri varken, gelecekteki hava tahminini kullanarak elektrik fiyatı tahmini yapmanın mümkün olup olmadığı soruluyor
    Yani bir zaman serisindeki X anı verisiyle başka bir zaman serisinin X anını tahmin etmek mümkün mü, yoksa yalnızca tek bir zaman serisinin iç örüntülerini mi ele alıyor diye soruluyor

    • Makalede odak noktasının tahmin(forecasting) olduğu belirtiliyor
      Ancak eğitim verisi azsa yalnızca “sağa yukarı giden” örüntüyü öğrenmekle sınırlı kalabileceği düşünülüyor
  • Bu proje gözden kaçmış; bununla ilgili bir yarışma olup olmadığı merak ediliyor
    Zaman serisi ve ML hep zordu, o yüzden bizzat denemek istiyorlar

  • Kişisel olarak LLM + pandas + kendi deney döngüsü ile bu modelden daha iyi sonuç alınabileceğini düşünenler var

    • Öyleyse bunu doğrudan denemek gerekir
      Sonuçta sınırlar önceden belirlenmiş değil; hatta bu iddianın yanlış çıkma ihtimali daha yüksek görünüyor