2 puan yazan GN⁺ 2024-03-25 | 1 yorum | WhatsApp'ta paylaş

Linux kriz araçları

  • Linux sunucularına varsayılan olarak kurulması gereken "kriz araçları" listesini ve bu araçları içeren (Ubuntu) paket adlarını sunuyor.
  • Temel istatistikler, sistem günlükleri, aygıt bilgileri, aygıt istatistikleri, ağ araçları, NUMA istatistikleri, ağ sniffer'ları, profiler'lar ve PMU istatistikleri için araçlar içeriyor.
  • bpfcc-tools (bcc) ve bpftrace, eBPF araçları sağlar; bcc daha fazla özelliğe sahiptir ve bpftrace gerçek zamanlı olarak düzenlenebilir.
  • Sunucuya göre belirli hızlandırıcı analiz araçlarının veya hata ayıklama araçlarının da önceden kurulması tavsiye edilir.
  • Bu temel analiz araçları sık değişmediği için yalnızca birkaç yılda bir güncellenmeleri gerekir.

Kriz anında araç kurulumunun önemi

  • Üretim ortamındaki kriz durumlarında yazılım kurulumu sırasında ortaya çıkabilecek sorunları örneklerle açıklıyor.
  • Sistem yavaşladığı için gerekli araçların kurulması uzun sürebilir ve çeşitli yapılandırma sorunları ya da güvenlik politikaları nedeniyle kurulum zor olabilir.
  • Kriz anında sorunları hızla teşhis edip çözebilmek için kriz araçlarının önceden kurulmuş olması tercih edilir.

GN⁺ görüşü

  • Bu yazı, sistem yöneticileri veya SRE'ler (site güvenilirliği mühendisleri) için çok faydalı bilgiler sunuyor. Gerçek kriz anlarında gereken araçların hızlıca kullanılabilmesi için önceden hazırlığın önemini vurguluyor.
  • Kriz araçlarının önceden kurulması, sistemin kullanılabilirliğini ve dayanıklılığını artırmaya katkı sağlar ve olası sistem kesinti sürelerini en aza indirmeye yardımcı olur.
  • Ancak güvenlik ile performans arasında denge kurmak önemlidir. Örneğin, sistemde gereksiz araçlar kuruluysa bir saldırgan bunları kötüye kullanabilir.
  • Linux dağıtımlarının kurumsal ortamlara uygun şekilde kriz araçlarını varsayılan olarak içermesi düşünülebilir, ancak bu her kuruluşun güvenlik politikalarına ve ihtiyaçlarına göre değişebilir.
  • Açık kaynak topluluğunda zaten çeşitli izleme ve performans analizi araçları sunuluyor; örneğin Prometheus ve Grafana gibi araçlar sistem performansı izleme için yaygın olarak kullanılıyor. Bu araçlarla birlikte kriz araçlarını entegre ederek kullanmak sistem yönetimini daha etkili hale getirebilir.

1 yorum

 
GN⁺ 2024-03-25
Hacker News görüşleri
  • 16:07'de paket kurulumu başarısız, depo çözülemiyor. /etc/apt yapılandırmasında bir sorun var…

    • Bulut ortamlarının dezavantajları var ama böyle durumlarda işe yarıyor. Karmaşık onarımlar yerine sorunlu makineyi kapatıp ya da havuzdan çıkarıp yeni bir makine kullanarak sorun çözülebiliyor.
  • Konteynerleştirilmiş çok sayıda sunucu var, ancak hâlâ zorluklar mevcut.

    • Docker imajlarının içindeki birçok araç, güvenlik tarama araçları tarafından risk unsuru olarak işaretleniyor. gdb gibi araçlar endişe konusu olabilir, ancak birçok araç için bu geçerli değil.
    • Bundan kaçınmak için araçlar ayrı bir volume üzerinde statik binary olarak tutuluyor ya da mount yolu kurulum öneki olarak kullanılıp derlenip kuruluyor. Debug gerektiğinde operasyon ekibi volume'ü geçici olarak salt okunur şekilde mount ediyor.
  • Belirli çekirdek özelliklerinin etkinleştirilmesini gerektiren debug araçları varsa, bunun aynı host üzerinde çalışan diğer konteynerler üzerindeki etkisi konusunda endişe duyuluyor.

  • FreeBSD sistemlerinde /rescue/ dizini var; yaklaşık 150 kritik aracı birleştiren, statik olarak linklenmiş tek bir yaklaşık 17 MB'lık binary sunuyor.

  • Netflix'te çalışırken Brendan ve ekibi, bpftrace, bcc, çalışan bir perf gibi debug araçlarını her yere kurmuştu ve bunlar defalarca hayat kurtardı.

  • Listede strace olmamasına şaşırdım. Özellikle program işe yaramayan ya da hatalı hata mesajları döndürdüğünde çok faydalı bir araç.

  • SRE tarzı pozisyonlar için mülakat yaparken bu araçları her zaman ele alıyorum. Adayın ezberlediği belirli komutlardan çok, nelerin mümkün olduğu, hangi tür araçların kullanılabildiği ve bunların nasıl kullanılacağı önemli.

  • Araç kurulumunun mümkün olmadığı kriz durumlarında, Docker üzerinden birçok yardımcı program çalıştırılabilir. Örneğin host ağına bağlı şekilde tcpdump çalıştıran bir Docker konteynerinin nasıl oluşturulup çalıştırılacağı anlatılıyor.

  • yum install tercih edilir, ancak Docker kullanılabiliyorsa ek eşlemeler gerekse bile bu uygulanabilir bir alternatif. rootless/podman yapılandırmalarında çalışmayabilir.

  • nmap, netstat, nc anılmamış. Bu araçlar birçok kez sorun çözmeye yardımcı oluyor.

  • Root erişimi alabiliyor musunuz? Herhangi bir işlem yapabilmek için sistem yöneticisine ticket açmak zorundayım.

  • Benim eklemek istediğim nmap. Ağ bağlantısı sorunları bazı uygulamalarda açıkça görünmeyebilir.