- ABD'nin Colorado eyaletindeki Boulder'da bulunan NIST zaman tesisi, elektrik kesintisi nedeniyle birkaç gün hizmet dışı kaldı; yedek jeneratör arızası yüzünden UTC referans saatine göre en fazla 5μs hata oluştu
- 6 NTP sunucusu işleten bu tesis, jeneratör arızasına rağmen zaman sapmasını 5μs'nin altında tuttu; genel kullanıcılar için neredeyse hiçbir etkisi olmadı
- Bilimsel araştırma kurumları ve havacılık-uzay şirketleri gibi hassas zamanlamaya bağımlı kuruluşlar etkilenmiş olabilir; NIST bu kurumlarla doğrudan çalışıyor
- GPS ve WWV-Ft. Collins sistemleri normal şekilde yedek rolünü üstlendi ve ABD genelindeki zaman altyapısının yedekliliği kanıtlandı
- Bu olay, GPS'e bağımlılığın risklerini ve zamanlama altyapısının kırılganlığını gösterirken, alternatif PNT sistemleri geliştirme ihtiyacını öne çıkardı
Elektrik kesintisi ve zaman hatasının ortaya çıkışı
- Colorado, Boulder'daki NIST kampüsünde saatte 160 km'yi (100mph) aşan şiddetli rüzgarlar nedeniyle elektrik şirketi, yangın riskini önlemek için elektriği kesti
- Tüm kampüs kapatıldı ve personelin girişine izin verilmedi; bu da onarımın gecikmesine yol açtı
- Yedek jeneratörlerden biri iki gün sonra arızalandı ve NTP sunucularının ana saat kümesinin (clock ensemble) elektriği kesildi
- Time Realization and Distribution Group yöneticisi Jeff Sherman, yanlış zaman yayını yapılmasını önlemek için sunucuları kapatma olasılığını bile değerlendirdi
- Neyse ki başka bir binadaki saat sistemi zaman sinyali gönderebildi ve bazı çalışanlar sahada kalarak acil güç yeniden yönlendirmesi ile sistemi toparladı
- Batarya yedeği (UPS), jeneratör değiştirilene kadar zamanı korudu; sonuçta UTC ile fark 5μs'nin altında kaldı
NTP sunucularının işletimi ve etki alanı
- NIST, 6 ana NTP sunucusu üzerinden internet zaman hizmeti sunuyor
sntp time-a-b.nist.gov komutunun sonucuna göre, genel kullanıcılar için ağ gecikmesinden kaynaklanan hata yaklaşık 35 milisaniye (35.000μs) seviyesinde; bu nedenle 5μs hata ihmal edilebilir düzeyde
- Bu yüzden sunucular kapatılmadan çalıştırılmaya devam edildi; doğruluk normalden yaklaşık 5.000 kat daha düşük olsa da çoğu kullanıcı etkilenmedi
- Üniversiteler, havacılık-uzay ve bilimsel araştırma kurumları gibi yerler çok küçük hatalara bile duyarlı olduğundan, NIST bu kurumlarla doğrudan düzeltme çalışmaları yürütüyor
- ABD GPS sistemi otomatik olarak WWV-Ft. Collins kampüsüne geçti ve hizmet, tam kesinti olmadan sürdürüldü
Zaman altyapısının kırılganlığı ve alternatif teknolojiler
- Yazar, Raspberry Pi tabanlı iki GPS saat kullanarak kendi NTP sunucusunu çalıştırdığını ve GPS'e bağımlılığın risklerine dikkat çekiyor
- CISA, ABD'nin GPS'e aşırı bağımlılığı riskine daha önce de dikkat çekmişti; hükümet ise alternatif PNT (Position, Navigation, Timing) teknolojileri geliştirmeyi sürdürüyor
- Broadcast Positioning System (BPS), GPS'e alternatif adaylardan biri olarak tartışılıyor
- Yazar, rubidyum atom saati ve GPSDO kullanarak birkaç nanosaniye düzeyinde doğruluğu koruduğunu; GPS sinyali bozulsa bile aylarca zamanı koruyabildiğini söylüyor
- Ancak bilim, RF, medya ve finans gibi alanlar nanosaniye düzeyinde hassasiyet gerektiriyor ve çoğu NIST referans saatine dayanıyor
Çıkarılan dersler ve sistem güvenilirliği
- Bu olay, NIST'in afet müdahale sisteminin gerçekten çalıştığını kanıtladı ve “küçük bir hata payıyla bile normal işletim”in mümkün olduğunu gösterdi
- Yedek güç, çoklu saatler ve GPS yedekleme sistemi birlikte çalışarak ülke genelindeki zaman altyapısının istikrarını korudu
- Yazar, “zamanlama altyapısı son derece kırılgan; çoklu yedekler şart” noktasını vurguluyor
- Mikrosaniye düzeyindeki kriz sırasında bile NIST ekibi sorunu çözdü ve sistem, çoğu kullanıcının fark etmeyeceği kadar sorunsuz biçimde toparlandı
1 yorum
Hacker News görüşleri
NIST'in Time Over Fiber (TOF) programı en ilginç olanıydı
Bu hizmet, fiber optik üzerinden yüksek hassasiyetli zaman aktarımı sağlıyor ve doğrudan bağlı bazı bağlantıların etkilendiği söyleniyor
Bu tür bir hizmeti ilk kez duyuyorum; muhtemelen finans sektörü (HFT, FINRA Rule 4590 ile ilgili), 5G senkronizasyonu ya da Google Spanner gibi küresel veritabanları için kullanılıyor olabilir
İlgili bağlantılar: NIST duyurusu, TOF program açıklaması, FINRA Rule 4590, 5G senkronizasyonuyla ilgili yazı
Gerçek zamanlı işlem sistemlerinde GPS yeterliydi ve mikrosaniye düzeyinde doğruluktan çok gecikme (latency) daha önemliydi
Düzenleyici gereklilikler de 1 saniyelik hataya izin verdiğinden TOF seviyesinde bir hassasiyet talep edilmiyor
Örneğin kütleçekim dalgaları ile gama ışını patlamalarını aynı anda gözlemlerken olduğu gibi, geniş bir alandaki verileri hassas biçimde senkronize etmek gerektiğinde buna ihtiyaç duyulur
Örneğin Schriever Space Force Base gibi yerler GPS'in ana kontrol noktaları arasında
Ayrıca GNSS sinyali kesildiğinde devreye girecek karasal zaman ağı olarak da önemli
İlgili haber: Çin'in yüksek hassasiyetli karasal zamanlama sistemini tamamlaması
Aslında sadece Boulder sunucularında bir senkronizasyon sorunu vardı
“NIST tamamen çevrimdışı kaldı” ifadesi abartılı
Sunucu durum sayfasına göre 16 IPv4 NTP sunucusunun yalnızca 5'i etkilendi, geri kalanlar normal çalışıyordu
Zaten çoğu kullanıcı doğrudan üst seviye sunucuları kullanmamalı, bu yüzden sorun neredeyse yoktu
Ben şahsen pool.ntp.org kullanılmasını öneririm
Hatanın yayılma ihtimali yok mu? pool.ntp.org kesinti ya da hata korelasyonundan kaçınacak şekilde dağıtılıyor mu, merak ediyorum
Küçük bir düzeltme ama UTC, “Coordinated Universal Time”ın kısaltmasıdır
Harf sırası, ne İngilizceye ne de Fransızcaya ayrıcalık tanımamak için bu şekilde düzenlenmiştir
UT0, UT1, UT2 gibi mevcut kısaltma sistemiyle tutarlılık da dikkate alınmıştı
Konudan biraz sapıyor ama chrony'yi övmek istiyorum
Çeşitli donanım ortamlarında, varsayılan OS NTP istemcisinden çok daha kararlıydı
Bu da performans ve kararlılığının kanıtlanmış olduğunu gösteriyor
Bu başlık o kadar ilginç ki okumayı bırakamıyorum
Belki de bugün Adderall'ı fazla kaçırdığımdandır
Tanıdığım bazı HFT trader'ları bu olaydan yüz binlerce dolar kazandıklarını söyledi
Sistemden bilinçli olarak mı yararlandılar, yoksa sadece şanslı bir glitch miydi, öğrenmek isterim
Eskiden “yanlış zaman göndermek, hiç zaman göndermemekten daha kötüdür” denirdi; bu yüzden bu kez neden hatalı bir zaman gönderildiğini pek anlamıyorum
NIST posta listesine göre internet üzerinden aktarımda genellikle 1ms seviyesinde belirsizlik oluşur; yani bu durum bilimsel hassasiyetle kıyaslanamaz
O sırada hem güç hem de yönetim erişimi kesilmişti; bu yüzden saatin ne kadar saptığı bilinmiyordu
Eğer güç geri gelir gelmez yanlış zaman yayılmaya başlasaydı, dünya çapındaki sistemlerde senkronizasyon hatalarına yol açabilirdi
Bu yüzden güvenli şekilde devre dışı bırakmak (scram) daha iyiydi
İlgili kısa öykü: The Time Rift of 2100
Örneğin bir yangın alarmının yanlış şekilde “sorun yok” demesindense, hiç yanıt vermemesi daha güvenlidir
“NIST'in saati felaketin eşiğindeydi” video başlığını anlamıyorum
Başka bir kampüsten zaman düzeltmesi yapılamaz mıydı?
Eğer gerçekten böyle bir hassasiyete ihtiyaç duyulan kullanım örnekleri varsa, bunu bir uzmanın açıklaması gerekir
İnsanların kesin zamana ihtiyaç duyduğu en önemli örneklerin neler olduğunu merak ediyorum
White Rabbit kullanarak RF güç sistemlerini ve veri toplama cihazlarını nanosaniye düzeyinde senkronize ediyoruz
TrueTime ile küresel işlem tutarlılığını garanti ediyor
Eğer bir GPS uydusu bu kadar sapmış olsaydı, konum doğruluğu Loran-C düzeyine düşerdi
Hikâye NPR makalesiyle başladı
Orijinal bağlantı