Grafana’yı artık neden öneremem

(henrikgerdes.me)

22 puan yazan GN⁺ 2025-11-17 | 5 yorum | WhatsApp'ta paylaş

Grafana ürün ailesi, ana bileşenleri kısa aralıklarla sık sık kullanımdan kaldırıp değiştirdiği için uzun vadeli işletimi zorlaştıran bir yapı oluşturuyor
Her yeni çözüm devreye alındığında yapılandırma yöntemi, DSL, Helm chart, Operator vb. tekrar tekrar değişiyor ve bu da istikrarlı bakım yapmayı zorlaştıran bir ortam yaratıyor
Prometheus Operator ekosistemiyle CRD uyumluluğu tam olmadığı için ServiceMonitor ve PodMonitor çalışsa da AlertmanagerConfig gibi kritik işlevlerde destek boşlukları oluşuyor
Mimir 3.0, Apache Kafka bağımlılığını zorunlu hale getirerek küme karmaşıklığını ve operasyon yükünü ciddi biçimde artırıyor
Grafana Cloud ile Mimir, Loki ve Grafana ürün ailesinin genelinde ayar konumları ve endpoint’ler kolayca değişebildiği için, bir kez kurup uzun süre kullanmayı zorlaştıran bir yapı tekrar ediyor

Grafana ürün ailesinde sık yapısal değişiklikler

Grafana Agent, Flow Mode, OnCall gibi çekirdek işlevlerde 1–3 yıl içinde kullanımdan kaldırma ve değiştirme döngüsü tekrar ediyor
- Angular tabanlı Grafana arayüzü React’e geçirilirken mevcut dashboard’ların önemli bir kısmı bozuldu
- Bazı Helm chart’ları artık bakım almıyor

Alloy’nin devreye girmesiyle artan karmaşıklık

Hepsi bir arada yaklaşımını savunan Grafana Alloy, mevcut Agent’ın yerini aldı ancak ilk dönemde kararlılık sorunları yaşandı
- Kendi DSL’sini (HCL benzeri) kullandığı için mevcut YAML tabanlı akıştan kopuyor
- Alloy Operator’ün de eklenmesiyle bileşenler daha da karmaşık hale geliyor

Prometheus Operator ekosistemiyle eksik uyum

K8s izleme standardı olan ServiceMonitor, PodMonitor destekleniyor ancak
- PrometheusRules için ek yapılandırma gerekiyor
- AlertmanagerConfig desteklenmiyor
- Mimir kendi Alertmanager’ını kullandığı için sürüm farkları ve ince uyumsuzluklar ortaya çıkıyor

Mimir 3.0’da Kafka bağımlılığının eklenmesi

Amaç eskisine göre daha yüksek ölçeklenebilirlik olsa da
- Çekirdek yapıya Kafka’yı zorunlu olarak ekleyerek operasyon zorluğunu ciddi biçimde artırıyor
- Tek bir Helm kurulumu → çok sayıda bileşenin koordinasyonuna geçişle karmaşıklık katlanarak büyüyor

İstikrarlı kullanımın zor olduğu bir ekosistem

Grafana Cloud ingestion endpoint’i, yeni bir yönetim sisteminin devreye alınmasıyla daha da zor bulunur hale geldi
Ana bileşenlerin yükseltme ve kullanımdan kaldırma döngüsü hızlı olduğu için “sıkıcı ama istikrarlı izleme” isteyen kurumlarla pek uyuşmuyor
Sorunun özü teknolojinin kendisinden çok, ürün yönetim biçimi ve hızlı değişim temposunun güvenilirliği zayıflatması olarak öne çıkıyor

5 yorum

ifmkl 2025-11-18

influxdb'nin varsayılan olarak sunduğu pano da basit işler için fena sayılmaz.

dongho42 2025-11-18

Grafana'nın pek iyi olmadığı konusunda katılıyorum ama Grafana kadar çok sayıda Datasource destekleyen, önermeye değer başka bir çözüm var mı acaba?

cysl0 2025-11-18

Belirgin bir alternatif de pek yok gibi.

savvykang 2025-11-18

Görünüşe göre Grafana'da da terfi etmek ya da özgeçmişini süslemek isteyen epey kişi varmış.

GN⁺ 2025-11-17

Hacker News görüşleri

Ben de yazarla aynı nedenlerden dolayı Grafana’yı tamamen bırakmayı ciddi ciddi düşünüyorum
Her yıl panoları yeniden yapmak, alarmları yeniden ayarlamak ve yeni özelliklere ayak uydurmak yorucu
Aslında sadece servis öldüğünde haber versin istiyorum ve veri kaynağı ya da metrikler değişmediği sürece aynı pano tanımını 10 yıl koruyabilmek istiyorum
Eskiden kenar çubuğunda sadece 4-5 ana bağlantı vardı, şimdi ise menüler içindeki alt menüler o kadar arttı ki temel işlevleri (panolar, alarmlar) bulmak bile zorlaştı
Ayda bir kadar baktığım bir arayüzü her seferinde yeniden öğrenmek zorunda olmak çok verimsiz
Servis ömrünün sadece 2-3 yıl olduğu bir ortamda üst üste bir sürü ürün yığmak, sonunda sadece teknik borç dağı büyüyormuş gibi hissettiriyor
Her çeyrekte büyük bir şeyi değiştirmek zorunda kalmanın gerçekliği acı verici
Mimir, tamamen farklı ölçekteki metrikleri işlemek için tasarlanmış bir sistem
O seviyede Kafka gerçekten gerekli
Ama çoğu kullanıcının bu kadar ölçeklenebilirliğe ihtiyacı yok
Mimir’i özel bir Kubernetes kümesinde çalıştırmıyorsanız, bu aşırı tasarlanmış demektir
Sadece Prometheus kullanmak daha gerçekçi
- Victoria Metrics öneririm
  Tek örnek modunda bile şaşırtıcı derecede iyi çalışıyor ve ölçeklendirmesi de çok kolay
  Bunu birden çok kuruluşta ve kişisel projede kullandım, hep memnun kaldım
- “Aynı sınıfta açık kaynak ölçeklenebilirlik yok” diye kesin konuşulması ilginç
  Ama AWS’nin Amazon Managed Prometheus’u Cortex tabanlı ve OpenObserve da zaten petabayt ölçeğinde çalışıyor
- Küçük uygulamaların izlenmesi için hangi çözümü tercih ettiğinizi merak ediyorum
  Tek binary olarak dağıtımı kolay, OpenTelemetry ile uyumlu ve ileride başka bir OTEL sağlayıcısına taşınabilen bir çözüm ideal olurdu
OTEL tabanlı yeni bir çözüm kurulacaksa, Prometheus/Grafana’ya alternatif olarak en umut verici seçeneğin hangisi olduğunu merak ediyorum
- Biz de kube-prometheus-stack ile başladık ama PromQL hoşumuza gitmedi
  Logları ve trace’leri işlemek için daha karmaşık bileşenler gerekiyordu
  Sonra GreptimeDB’yi bulduk; metrik, log ve trace’i birleşik şekilde işleyebiliyor
  Toplamayı OpenTelemetry ile yapıyor, görselleştirmeyi Grafana ile gerçekleştiriyoruz
  SQL ile pano oluşturabilmek ekibin yetkinliğiyle iyi örtüşüyor
  Basit yapısı sayesinde platform mühendisi olarak memnunum
- OpenObserve öneririm
  Grafana ve Elastic’in karmaşıklığını çözmek için yapıldı; tek bir container ile log, metrik, trace, pano ve alarmı birlikte yönetebiliyor
  (Yazan kişi OpenObserve’un maintainer’ı)
- Son dönemde şirkette Grafana’dan SigNoz’a geçiyoruz
  Açık kaynak, aktif olarak geliştiriliyor ve ekip iletişimi de iyi
- SigNoz, OpenTelemetry-native bir açık kaynak projesi
  Grafana’da birden fazla backend’i doğrudan yönetmenin karmaşıklığından kaçmak isteyen birçok kullanıcı buraya geçiyor
  (Yazan kişi SigNoz maintainer’ı)
Geliştiricilerin neden her hafta ayar değiştirip en yeni teknolojinin peşinden koştuğunu anlamıyorum
Ben 2017’den beri Grafana + Prometheus kombinasyonunu kullanıyorum ve hâlâ gayet iyi çalışıyor
Sadece 1-2 yılda bir, o da LTS sürümüne güncelliyorum
Panolar hâlâ kusursuz ve hiçbir sorun yok
Çoğu insan için bu sıkıcı ama istikrarlı kombinasyon en iyi seçenek
- Angular desteği kesildiğinde bunu nasıl yönettiğinizi merak ediyorum
  Acaba eski sürümü olduğu gibi mi kullanıyorsunuz, diye sormak isterim
Açık kaynak dünyasında Grafana’nın yerini alabilecek bir pano oluşturucu var mı? Şirkette de Grafana’yı yaygın biçimde kullanıyoruz
- Perses en umut verici alternatif gibi görünüyor
  Ya da Prometheus console templates veya VictoriaMetrics’in gömülü panoları kullanılabilir, ama özellikleri çok daha sınırlı
- Yazarın şikâyeti Grafana’nın kendisinden çok, o şirketin diğer ürün ailesine yönelik gibi görünüyor
  Grafana panolarının kendisi ise VictoriaMetrics + ClickHouse kombinasyonuyla kullanıldığında oldukça rahat
- Eskiden Grafana’dan önce de çeşitli FOSS alternatifleri vardı ama çoğu ortadan kayboldu
  RRD ve Nagios gibi isimleri ancak belirsiz biçimde hatırlıyorum
- OpenSearch Dashboards da bir alternatif, ama saf görselleştirme için Grafana hâlâ daha iyi
- Biz Graylog + ElasticSearch kombinasyonuyla Loki yığınını tamamen değiştirdik
Grafana’daki bitmek bilmeyen değişim bir noktadan sonra insana alışkanlık kazandırıyor
Her major release’te panolar bozuluyor ya da arayüz değişiyor ama insan artık “neyse” deyip geçiyor
Asıl sorun Prometheus’un PromQL kilitlenmesi
Metrik adını değiştirirseniz tüm kuralları, alarmları ve panoları güncellemeniz gerekiyor
PromQL sözdizimi hataları dışında neredeyse hiç hata vermediği için pint gibi araçlarla doğrulamak gerekiyor
- PromQL sorunu Grafana’dan çok Prometheus’un sorumluluğu
Tek sunucu dağıtımlarında Prometheus Pushgateway + Grafana’yı sık sık docker-compose şablonu olarak kullanıyorum
Basit ve iyi çalışıyor ama metrik miktarı büyüyünce karmaşıklık patlıyor
Prometheus daha verimli bir aktarim biçimi korusaydı bu sorun daha hafif olurdu
Metin biçimi yerine derli toplu bir ikili metrik biçimi olsaydı milyonlarca etiketi bile zorlanmadan işleyebilirdi
SigNoz iyi bir seçim ve aktif olarak geliştiriliyor
- Ben de SigNoz’a katılıyorum
  Eskiden bulut gözlemlenebilirlik platformlarına büyük para harcıyordum, şimdi ise bir Hetzner kutusunda self-hosted SigNoz çalıştırarak işi aylık 10 dolara çözüyorum
Prometheus ve Grafana’nın ikisi de full-stack çözüm olmaya yönelirken OTEL ortaya çıktı ve tabloyu karmaşıklaştırdı
- OTEL’in açık kaynak izleme yığınında tam olarak nasıl konumlandığını hâlâ tamamen anlamış değilim
  OTEL, metrik, trace ve loglar için bir protokol ama bunların hepsini destekleyen tek bir veritabanı yok
  Çoğu kişi Prometheus (metrik) + OpenSearch (log) kombinasyonunu kullanıyor
  Sonuçta OTEL, toplayıcı değişimi ve yeniden yapılandırma gerektiriyor gibi görünüyor