1 puan yazan GN⁺ 2025-12-24 | 1 yorum | WhatsApp'ta paylaş
  • ABD'nin Colorado eyaletindeki Boulder'da bulunan NIST zaman tesisi, elektrik kesintisi nedeniyle birkaç gün hizmet dışı kaldı; yedek jeneratör arızası yüzünden UTC referans saatine göre en fazla 5μs hata oluştu
  • 6 NTP sunucusu işleten bu tesis, jeneratör arızasına rağmen zaman sapmasını 5μs'nin altında tuttu; genel kullanıcılar için neredeyse hiçbir etkisi olmadı
  • Bilimsel araştırma kurumları ve havacılık-uzay şirketleri gibi hassas zamanlamaya bağımlı kuruluşlar etkilenmiş olabilir; NIST bu kurumlarla doğrudan çalışıyor
  • GPS ve WWV-Ft. Collins sistemleri normal şekilde yedek rolünü üstlendi ve ABD genelindeki zaman altyapısının yedekliliği kanıtlandı
  • Bu olay, GPS'e bağımlılığın risklerini ve zamanlama altyapısının kırılganlığını gösterirken, alternatif PNT sistemleri geliştirme ihtiyacını öne çıkardı

Elektrik kesintisi ve zaman hatasının ortaya çıkışı

  • Colorado, Boulder'daki NIST kampüsünde saatte 160 km'yi (100mph) aşan şiddetli rüzgarlar nedeniyle elektrik şirketi, yangın riskini önlemek için elektriği kesti
    • Tüm kampüs kapatıldı ve personelin girişine izin verilmedi; bu da onarımın gecikmesine yol açtı
  • Yedek jeneratörlerden biri iki gün sonra arızalandı ve NTP sunucularının ana saat kümesinin (clock ensemble) elektriği kesildi
  • Time Realization and Distribution Group yöneticisi Jeff Sherman, yanlış zaman yayını yapılmasını önlemek için sunucuları kapatma olasılığını bile değerlendirdi
  • Neyse ki başka bir binadaki saat sistemi zaman sinyali gönderebildi ve bazı çalışanlar sahada kalarak acil güç yeniden yönlendirmesi ile sistemi toparladı
  • Batarya yedeği (UPS), jeneratör değiştirilene kadar zamanı korudu; sonuçta UTC ile fark 5μs'nin altında kaldı

NTP sunucularının işletimi ve etki alanı

  • NIST, 6 ana NTP sunucusu üzerinden internet zaman hizmeti sunuyor
  • sntp time-a-b.nist.gov komutunun sonucuna göre, genel kullanıcılar için ağ gecikmesinden kaynaklanan hata yaklaşık 35 milisaniye (35.000μs) seviyesinde; bu nedenle 5μs hata ihmal edilebilir düzeyde
  • Bu yüzden sunucular kapatılmadan çalıştırılmaya devam edildi; doğruluk normalden yaklaşık 5.000 kat daha düşük olsa da çoğu kullanıcı etkilenmedi
  • Üniversiteler, havacılık-uzay ve bilimsel araştırma kurumları gibi yerler çok küçük hatalara bile duyarlı olduğundan, NIST bu kurumlarla doğrudan düzeltme çalışmaları yürütüyor
  • ABD GPS sistemi otomatik olarak WWV-Ft. Collins kampüsüne geçti ve hizmet, tam kesinti olmadan sürdürüldü

Zaman altyapısının kırılganlığı ve alternatif teknolojiler

  • Yazar, Raspberry Pi tabanlı iki GPS saat kullanarak kendi NTP sunucusunu çalıştırdığını ve GPS'e bağımlılığın risklerine dikkat çekiyor
  • CISA, ABD'nin GPS'e aşırı bağımlılığı riskine daha önce de dikkat çekmişti; hükümet ise alternatif PNT (Position, Navigation, Timing) teknolojileri geliştirmeyi sürdürüyor
  • Broadcast Positioning System (BPS), GPS'e alternatif adaylardan biri olarak tartışılıyor
  • Yazar, rubidyum atom saati ve GPSDO kullanarak birkaç nanosaniye düzeyinde doğruluğu koruduğunu; GPS sinyali bozulsa bile aylarca zamanı koruyabildiğini söylüyor
  • Ancak bilim, RF, medya ve finans gibi alanlar nanosaniye düzeyinde hassasiyet gerektiriyor ve çoğu NIST referans saatine dayanıyor

Çıkarılan dersler ve sistem güvenilirliği

  • Bu olay, NIST'in afet müdahale sisteminin gerçekten çalıştığını kanıtladı ve “küçük bir hata payıyla bile normal işletim”in mümkün olduğunu gösterdi
  • Yedek güç, çoklu saatler ve GPS yedekleme sistemi birlikte çalışarak ülke genelindeki zaman altyapısının istikrarını korudu
  • Yazar, “zamanlama altyapısı son derece kırılgan; çoklu yedekler şart” noktasını vurguluyor
  • Mikrosaniye düzeyindeki kriz sırasında bile NIST ekibi sorunu çözdü ve sistem, çoğu kullanıcının fark etmeyeceği kadar sorunsuz biçimde toparlandı

1 yorum

 
GN⁺ 2025-12-24
Hacker News görüşleri
  • NIST'in Time Over Fiber (TOF) programı en ilginç olanıydı
    Bu hizmet, fiber optik üzerinden yüksek hassasiyetli zaman aktarımı sağlıyor ve doğrudan bağlı bazı bağlantıların etkilendiği söyleniyor
    Bu tür bir hizmeti ilk kez duyuyorum; muhtemelen finans sektörü (HFT, FINRA Rule 4590 ile ilgili), 5G senkronizasyonu ya da Google Spanner gibi küresel veritabanları için kullanılıyor olabilir
    İlgili bağlantılar: NIST duyurusu, TOF program açıklaması, FINRA Rule 4590, 5G senkronizasyonuyla ilgili yazı

    • HFT'de böyle bir hassasiyete ihtiyaç yoktu
      Gerçek zamanlı işlem sistemlerinde GPS yeterliydi ve mikrosaniye düzeyinde doğruluktan çok gecikme (latency) daha önemliydi
      Düzenleyici gereklilikler de 1 saniyelik hataya izin verdiğinden TOF seviyesinde bir hassasiyet talep edilmiyor
    • Muhtemelen bilimsel deneyler içindir
      Örneğin kütleçekim dalgaları ile gama ışını patlamalarını aynı anda gözlemlerken olduğu gibi, geniş bir alandaki verileri hassas biçimde senkronize etmek gerektiğinde buna ihtiyaç duyulur
    • Bunun ticari kullanıcılar için olduğunu varsayamayız
      Örneğin Schriever Space Force Base gibi yerler GPS'in ana kontrol noktaları arasında
    • Muhtemelen öncelik White Rabbit Project gibi bilimsel araştırma kullanımlarıdır
      Ayrıca GNSS sinyali kesildiğinde devreye girecek karasal zaman ağı olarak da önemli
      İlgili haber: Çin'in yüksek hassasiyetli karasal zamanlama sistemini tamamlaması
    • SIGINT ağlarında çok hassas TDOA (Time Difference of Arrival) hesaplamaları için referans saat olarak da kullanılabilir
  • Aslında sadece Boulder sunucularında bir senkronizasyon sorunu vardı
    “NIST tamamen çevrimdışı kaldı” ifadesi abartılı
    Sunucu durum sayfasına göre 16 IPv4 NTP sunucusunun yalnızca 5'i etkilendi, geri kalanlar normal çalışıyordu
    Zaten çoğu kullanıcı doğrudan üst seviye sunucuları kullanmamalı, bu yüzden sorun neredeyse yoktu
    Ben şahsen pool.ntp.org kullanılmasını öneririm

    • Üst seviye sunucuları gerçekte kimin kullandığını merak ediyorum
      Hatanın yayılma ihtimali yok mu? pool.ntp.org kesinti ya da hata korelasyonundan kaçınacak şekilde dağıtılıyor mu, merak ediyorum
    • time.nist.gov DNS round-robin kullandığı için bazı kullanıcılar Boulder sunucularına bağlanıp 5μs hata yaşamış olabilir
  • Küçük bir düzeltme ama UTC, “Coordinated Universal Time”ın kısaltmasıdır
    Harf sırası, ne İngilizceye ne de Fransızcaya ayrıcalık tanımamak için bu şekilde düzenlenmiştir

    • Buna “Universal Time, Coordinated” da denir
    • Wikipedia'ya göre bu, uluslararası kuruluşların tüm dillerde aynı kısaltmanın kullanılmasında anlaşmasının sonucuydu
      UT0, UT1, UT2 gibi mevcut kısaltma sistemiyle tutarlılık da dikkate alınmıştı
    • Bu arada İzlanda standart saati de UTC ile aynıdır
    • Bu adlandırma geçmişi oldukça ilginç
    • Fransızca karşılığı “Universel Temps Coordonné
  • Konudan biraz sapıyor ama chrony'yi övmek istiyorum
    Çeşitli donanım ortamlarında, varsayılan OS NTP istemcisinden çok daha kararlıydı

    • Nitekim RHEL ve SLES gibi dağıtımlarda chrony zaten varsayılan
      Bu da performans ve kararlılığının kanıtlanmış olduğunu gösteriyor
  • Bu başlık o kadar ilginç ki okumayı bırakamıyorum
    Belki de bugün Adderall'ı fazla kaçırdığımdandır

  • Tanıdığım bazı HFT trader'ları bu olaydan yüz binlerce dolar kazandıklarını söyledi

    • Bunun nasıl mümkün olduğunu merak ediyorum
      Sistemden bilinçli olarak mı yararlandılar, yoksa sadece şanslı bir glitch miydi, öğrenmek isterim
  • Eskiden “yanlış zaman göndermek, hiç zaman göndermemekten daha kötüdür” denirdi; bu yüzden bu kez neden hatalı bir zaman gönderildiğini pek anlamıyorum

    • 5μs hata, NTP kullanıcıları için fiilen anlamsızdır
      NIST posta listesine göre internet üzerinden aktarımda genellikle 1ms seviyesinde belirsizlik oluşur; yani bu durum bilimsel hassasiyetle kıyaslanamaz
    • Güzel soru
      O sırada hem güç hem de yönetim erişimi kesilmişti; bu yüzden saatin ne kadar saptığı bilinmiyordu
      Eğer güç geri gelir gelmez yanlış zaman yayılmaya başlasaydı, dünya çapındaki sistemlerde senkronizasyon hatalarına yol açabilirdi
      Bu yüzden güvenli şekilde devre dışı bırakmak (scram) daha iyiydi
      İlgili kısa öykü: The Time Rift of 2100
    • Bazen ilke şudur: yanlış cevap almaktansa hiç cevap almamak daha iyidir
      Örneğin bir yangın alarmının yanlış şekilde “sorun yok” demesindense, hiç yanıt vermemesi daha güvenlidir
  • “NIST'in saati felaketin eşiğindeydi” video başlığını anlamıyorum
    Başka bir kampüsten zaman düzeltmesi yapılamaz mıydı?

    • Şakayla karışık, “Sebebi sizi şaşırtacak” diye yanıt vermişler
    • Gerçekte bu bir clickbait başlık gibi duruyor
      Eğer gerçekten böyle bir hassasiyete ihtiyaç duyulan kullanım örnekleri varsa, bunu bir uzmanın açıklaması gerekir
  • İnsanların kesin zamana ihtiyaç duyduğu en önemli örneklerin neler olduğunu merak ediyorum

    • Ben bir parçacık hızlandırıcıda çalışıyorum
      White Rabbit kullanarak RF güç sistemlerini ve veri toplama cihazlarını nanosaniye düzeyinde senkronize ediyoruz
    • Google Spanner bunun önde gelen örneklerinden biri
      TrueTime ile küresel işlem tutarlılığını garanti ediyor
    • Uzay araçlarının durum vektörü hesaplamalarında da vazgeçilmezdir
    • Sentetik açıklıklı radyo teleskop gibi sistemlerde de farklı bölgelerdeki saatlerin hassas biçimde eşleştirilmesi gerekir
    • Bu arada 5μs hata, radyo dalgasının kat ettiği mesafe olarak yaklaşık 1500m'ye karşılık gelir
      Eğer bir GPS uydusu bu kadar sapmış olsaydı, konum doğruluğu Loran-C düzeyine düşerdi
  • Hikâye NPR makalesiyle başladı
    Orijinal bağlantı