TimesFM - Google'ın 200 milyon parametreli, 16k bağlamlı zaman serisi temel modeli

(github.com/google-research)

7 puan yazan GN⁺ 28 일 전 | 1 yorum | WhatsApp'ta paylaş

TimesFM, Google Research tarafından geliştirilen zaman serisi tahmini için büyük ölçekli bir önceden eğitilmiş modeldir ve yalnızca decoder mimarisi kullanır
En güncel sürüm 2.5, 200 milyon parametre, 16k bağlam uzunluğu ve maksimum 1k horizon tahmini desteği sunar
Sürekli quantile tahmini, eşdeğişken girişi (XReg), Flax ve PyTorch backend'leri gibi çeşitli özellikler içerir
Model Hugging Face üzerinden yayımlanır ve BigQuery ile de entegre şekilde kullanılabilir
Zaman serisi verisi tahmini için genel amaçlı bir temel model olarak hem araştırma hem de pratik kullanımda ölçeklenebilirlik ve verimlilik sunar

TimesFM genel bakış

TimesFM (Time Series Foundation Model), Google Research tarafından geliştirilen zaman serisi tahmini için önceden eğitilmiş bir modeldir
ICML 2024 makalesi “A decoder-only foundation model for time-series forecasting” temel alınmıştır
Model checkpoint'leri Hugging Face koleksiyonu üzerinden sunulur ve BigQuery ile de resmi olarak entegredir
Açık sürüm resmi bir Google ürünü değildir

Model sürümleri ve başlıca güncellemeler

En güncel sürüm TimesFM 2.5'tir; önceki sürümler (1.0, 2.0) v1 dizininde saklanır ve timesfm==1.3.0 ile kurulabilir
15 Eylül 2025 güncellemesi
- TimesFM 2.5 modeli yayımlandı
- Parametre sayısı 200M'e düşürüldü (önceki 500M'in yarısından da az)
- Bağlam uzunluğu 16k'ye çıkarıldı (önceki 2048'den artırıldı)
- Sürekli quantile tahmini (continuous quantile forecast), maksimum 1k horizon'a kadar desteklenir; isteğe bağlı 30M quantile head dahildir
- frequency göstergesi kaldırıldı
- Yeni forecasting flag'leri eklendi
- Inference API yükseltildi
- Gelecekte eklenmesi planlananlar
  1. Flax sürümü model desteği (daha hızlı çıkarım)
  2. Eşdeğişken (covariate) desteğinin geri getirilmesi
  3. docstring, dokümantasyon ve notebook'ların güçlendirilmesi
29 Ekim 2025 güncellemesi
- XReg üzerinden eşdeğişken (covariate) girişi desteği, TimesFM 2.5'e yeniden eklendi

Kurulum yöntemi

GitHub deposunu klonlayıp uv kullanarak sanal ortam oluşturma ve paket kurma
- torch, flax, xreg arasından isteğe bağlı backend kurulabilir
- İşletim sistemi ve hızlandırıcıya (CPU, GPU, TPU, Apple Silicon) göre PyTorch veya JAX (Flax) seçilebilir

Kod örneği

PyTorch tabanlı TimesFM 2.5 (200M parametre) modelini yükleme örneği verilir
- timesfm.TimesFM_2p5_200M_torch.from_pretrained("google/timesfm-2.5-200m-pytorch") kullanılır
- ForecastConfig ile girdi normalizasyonu (normalize_inputs), sürekli quantile head kullanımı, pozitiflik zorlama (infer_is_positive), quantile kesişimi düzeltme (fix_quantile_crossing) gibi ayarlar yapılabilir
- forecast() çağrıldığında point forecast ve quantile forecast olmak üzere iki sonuç döner
  - point_forecast.shape: (2, 12)
  - quantile_forecast.shape: (2, 12, 10) — ortalama ile 10~90 quantile dahil

1 yorum

GN⁺ 28 일 전

Hacker News görüşleri

Genel bir zaman serisi modeli fikri biraz tuhaf geliyor
Aynı modelin İtalya’daki yumurta fiyatlarını ve küresel enflasyonu aynı anda nasıl güvenilir biçimde tahmin edebildiği sorgulanıyor
Üstelik tahminin gerekçesini açıklamıyorsa, sonucun güvenilmesinin zor olması da ayrı bir sorun gibi görünüyor
- Aslında bu tür modeller yumurta fiyatını ya da enflasyonun kendisini tahmin etmiyor; zaman serisi verisini trend·mevsimsellik·artık bileşenlerine ayırıyor
  Orta Doğu’daki savaş gibi mevsimsel olmayan olayların enflasyonu etkilemesi modelin yakalayabileceği bir şey değil
- Anladığım kadarıyla yapı, sentetik eğitim verisinin farklı alanlarda ortak görülen soyut zaman serisi örüntülerini yakalamaya yardımcı olması üzerine kurulu
  Makalenin ek 8. bölümüne göre, lineer trendler, ARMA, sinüs·kosinüs mevsimsel örüntüler gibi geleneksel istatistiksel modellerle sentetik veri üretilip eğitim yapılıyor
  Sonuçta bu bir Transformer mimarisi olduğu için, LLM’ler gibi giriş bağlamına göre probleme özgü örüntüleri buluyor
- Google Ads’de çalışırken reklam kampanyalarının hedefe ulaşma olasılığını tahmin etmek için zaman serisi tahmini kullanmıştım
  Birçok reklamveren yalnızca mevcut değerlerden düz bir çizgi çekerek tahminde bulunuyordu ama haftanın günü·mevsimsellik etkilerini yansıtmadığı için bu yöntem isabetsizdi
  Buna karşılık zaman serisi modeli çok daha doğruydu ve tüm kampanya verisiyle eğitildiğinde %95 güven aralığı sağlayabiliyordu
- Benford yasası(Benford’s law) da uygulanabilir
  İşaret ve üs yavaş değiştiği için bunlar tahmin edilir, anlamlı kısım ise Benford yasasıyla kestirilir
- Yaklaşım olarak
  - ayrıştırma(decomposition): Fourier dönüşümünün genel biçimini bularak temel etkenleri ayırma
  - ezberleme(memorization): farklı alanlarda tekrar eden örüntüleri (ör. kuvvet yasası) öğrenme
  - çok görevli(multitask): hava durumu ve elektrik gibi alanlar arası ilişkilerden yararlanma
Başlığa (2024) eklenmesi iyi olabilir
Zaten Google Research blogunda tanıtılmış bir içerik olduğu için yeni bir haber değil
- Ama 2025 sonlarında büyük bir güncelleme olmuştu
İlgili blog yazısı GitHub’daki TimesFM sayfasında görülebilir
- Muhtemelen şu Google Research blog yazısına bağlantı vermek istenmişti
- Toplam GPU eğitim süresi merak ediliyor
  LLM’lere göre çok daha düşük görünüyor; bireysel araştırmacıların ya da üniversite laboratuvarlarının da eğitebileceği bir şey olup olmadığı bilinmek isteniyor
- iOS Chrome’da gönderilen GitHub deposuyla aynı içerik açılıyor
Benzer projeler olarak Nixtla ve Prophet var
- Bir başka örnek de Amazon Chronos Forecasting
“Bunu ELI5 düzeyinde açıklayabilir misiniz? Ve kaç veri noktasını okuyabiliyor?” diye sorulmuş
Zaman serisinin bağlam olmadan yalnızca bir sayı kümesi olarak mı verildiği merak ediliyor
Modelin veriye bakıp bunun hangi kategoriye ait olduğunu (hisse fiyatı, arama trendleri vb.) tahmin ettikten sonra buna uygun bir tahmin ürettiği düşünülüyor
Ancak eğitim verisinde olmayan kategorilerde zayıf kalabilir gibi görünüyor
Kişisel olarak ARIMA gibi basit modelleri ya da teori temelli modelleri tercih ettiğini söyleyenler var
- Yine de LLM’lerin uzun token akışında bir sonraki token’ı tahmin etmesi gibi, bu model de çalışabilir
  Asıl mesele mimari ve eğitim biçiminin ne kadar genellenebilir olduğu
Bu model birkaç aydır açık durumdaydı; gerçekten bunun üzerine bir şey inşa eden örnekler olup olmadığı merak ediliyor
Geçmiş güneş ışınımı ve hava tahmini zaman serileri varken, gelecekteki hava tahminini kullanarak elektrik fiyatı tahmini yapmanın mümkün olup olmadığı soruluyor
Yani bir zaman serisindeki X anı verisiyle başka bir zaman serisinin X anını tahmin etmek mümkün mü, yoksa yalnızca tek bir zaman serisinin iç örüntülerini mi ele alıyor diye soruluyor
- Makalede odak noktasının tahmin(forecasting) olduğu belirtiliyor
  Ancak eğitim verisi azsa yalnızca “sağa yukarı giden” örüntüyü öğrenmekle sınırlı kalabileceği düşünülüyor
Bu proje gözden kaçmış; bununla ilgili bir yarışma olup olmadığı merak ediliyor
Zaman serisi ve ML hep zordu, o yüzden bizzat denemek istiyorlar
- İlgili kaynak olarak Datadog blogu, Moment projesi, arXiv makalesi öneriliyor
  Bir meslektaşı bu modelle CEO’nun Slack’e ne zaman yazı yazacağını tahmin etmiş ve oldukça eğlenceli olduğunu söylemiş
- Hugging Face GIFT liderlik tablosunda da Transformer tabanlı modeller var
- Bir başka proje de OpenTSLM
- TabPFN de zaman serisi özelliklerini destekliyor
Kişisel olarak LLM + pandas + kendi deney döngüsü ile bu modelden daha iyi sonuç alınabileceğini düşünenler var
- Öyleyse bunu doğrudan denemek gerekir
  Sonuçta sınırlar önceden belirlenmiş değil; hatta bu iddianın yanlış çıkma ihtimali daha yüksek görünüyor

TimesFM - Google'ın 200 milyon parametreli, 16k bağlamlı zaman serisi temel modeli

TimesFM genel bakış

Model sürümleri ve başlıca güncellemeler

15 Eylül 2025 güncellemesi

29 Ekim 2025 güncellemesi

Kurulum yöntemi

Kod örneği

İlgili okumalar

1 yorum

Hacker News görüşleri