Linux kriz araçları
- Linux sunucularına varsayılan olarak kurulması gereken "kriz araçları" listesini ve bu araçları içeren (Ubuntu) paket adlarını sunuyor.
- Temel istatistikler, sistem günlükleri, aygıt bilgileri, aygıt istatistikleri, ağ araçları, NUMA istatistikleri, ağ sniffer'ları, profiler'lar ve PMU istatistikleri için araçlar içeriyor.
bpfcc-tools (bcc) ve bpftrace, eBPF araçları sağlar; bcc daha fazla özelliğe sahiptir ve bpftrace gerçek zamanlı olarak düzenlenebilir.
- Sunucuya göre belirli hızlandırıcı analiz araçlarının veya hata ayıklama araçlarının da önceden kurulması tavsiye edilir.
- Bu temel analiz araçları sık değişmediği için yalnızca birkaç yılda bir güncellenmeleri gerekir.
Kriz anında araç kurulumunun önemi
- Üretim ortamındaki kriz durumlarında yazılım kurulumu sırasında ortaya çıkabilecek sorunları örneklerle açıklıyor.
- Sistem yavaşladığı için gerekli araçların kurulması uzun sürebilir ve çeşitli yapılandırma sorunları ya da güvenlik politikaları nedeniyle kurulum zor olabilir.
- Kriz anında sorunları hızla teşhis edip çözebilmek için kriz araçlarının önceden kurulmuş olması tercih edilir.
GN⁺ görüşü
- Bu yazı, sistem yöneticileri veya SRE'ler (site güvenilirliği mühendisleri) için çok faydalı bilgiler sunuyor. Gerçek kriz anlarında gereken araçların hızlıca kullanılabilmesi için önceden hazırlığın önemini vurguluyor.
- Kriz araçlarının önceden kurulması, sistemin kullanılabilirliğini ve dayanıklılığını artırmaya katkı sağlar ve olası sistem kesinti sürelerini en aza indirmeye yardımcı olur.
- Ancak güvenlik ile performans arasında denge kurmak önemlidir. Örneğin, sistemde gereksiz araçlar kuruluysa bir saldırgan bunları kötüye kullanabilir.
- Linux dağıtımlarının kurumsal ortamlara uygun şekilde kriz araçlarını varsayılan olarak içermesi düşünülebilir, ancak bu her kuruluşun güvenlik politikalarına ve ihtiyaçlarına göre değişebilir.
- Açık kaynak topluluğunda zaten çeşitli izleme ve performans analizi araçları sunuluyor; örneğin Prometheus ve Grafana gibi araçlar sistem performansı izleme için yaygın olarak kullanılıyor. Bu araçlarla birlikte kriz araçlarını entegre ederek kullanmak sistem yönetimini daha etkili hale getirebilir.
1 yorum
Hacker News görüşleri
Konteynerleştirilmiş çok sayıda sunucu var, ancak hâlâ zorluklar mevcut.
gdbgibi araçlar endişe konusu olabilir, ancak birçok araç için bu geçerli değil.Belirli çekirdek özelliklerinin etkinleştirilmesini gerektiren debug araçları varsa, bunun aynı host üzerinde çalışan diğer konteynerler üzerindeki etkisi konusunda endişe duyuluyor.
FreeBSD sistemlerinde
/rescue/dizini var; yaklaşık 150 kritik aracı birleştiren, statik olarak linklenmiş tek bir yaklaşık 17 MB'lık binary sunuyor.Netflix'te çalışırken Brendan ve ekibi,
bpftrace,bcc, çalışan birperfgibi debug araçlarını her yere kurmuştu ve bunlar defalarca hayat kurtardı.Listede
straceolmamasına şaşırdım. Özellikle program işe yaramayan ya da hatalı hata mesajları döndürdüğünde çok faydalı bir araç.SRE tarzı pozisyonlar için mülakat yaparken bu araçları her zaman ele alıyorum. Adayın ezberlediği belirli komutlardan çok, nelerin mümkün olduğu, hangi tür araçların kullanılabildiği ve bunların nasıl kullanılacağı önemli.
Araç kurulumunun mümkün olmadığı kriz durumlarında, Docker üzerinden birçok yardımcı program çalıştırılabilir. Örneğin host ağına bağlı şekilde
tcpdumpçalıştıran bir Docker konteynerinin nasıl oluşturulup çalıştırılacağı anlatılıyor.yum installtercih edilir, ancak Docker kullanılabiliyorsa ek eşlemeler gerekse bile bu uygulanabilir bir alternatif. rootless/podmanyapılandırmalarında çalışmayabilir.nmap,netstat,ncanılmamış. Bu araçlar birçok kez sorun çözmeye yardımcı oluyor.Root erişimi alabiliyor musunuz? Herhangi bir işlem yapabilmek için sistem yöneticisine ticket açmak zorundayım.
Benim eklemek istediğim
nmap. Ağ bağlantısı sorunları bazı uygulamalarda açıkça görünmeyebilir.