- Son günlerde A320 Family uçakları ile ilgili olay analizlerinde, yoğun güneş ışınımının uçuş kontrolü için gerekli kritik verileri bozabileceği doğrulandı
- Airbus bu nedenle, hareket halindeki çok sayıda A320 ailesi uçağının etkilenme olasılığı taşıdığını tespit etti
- Şirket, bu nedenle havacılık otoriteleriyle iş birliği içinde acil önleyici adımların uygulanması için Alert Operators Transmission (AOT) yayımladı; bu adım ileride EASA Acil Uçuşa Elverişlilik Direktifi (Emergency Airworthiness Directive) olarak resmi hale getirilecek
- Airbus, bu önlemler nedeniyle yolcu ve müşterilerin operasyon programlarında gecikme veya aksama yaşanabileceğini kabul ederek, havayolu operatörleriyle yakın iş birliği içinde yanıt veriyor
- Tüm adımların ilk önceliği uçuş güvenliğinin sağlanmasıdır
A320 Family için önleyici eylem özeti
- A320 Family uçaklarında yapılan son olay analizlerinde güçlü güneş ışınımının (intense solar radiation) uçuş kontrol sisteminin kritik verilerini bozabileceği tespit edildi
- Bu durum, uçuş kontrol fonksiyonları (flight controls) için gereken verinin bütünlüğünü etkileyebilir
- Airbus, şu anda operasyonel olarak hizmette bulunan A320 ailesi uçaklarının önemli bir bölümünün bu sorundan etkilenebileceğine karar verdi
Önleyici önlem ve otoritelerle iş birliği
- Airbus, havacılık otoriteleriyle iş birliği içinde acil önleyici adımların uygulanması için Alert Operators Transmission (AOT) yayımladı
- AOT, güvenli uçuşu güvence altına almak amacıyla uçağa yazılım ve/veya donanım koruma önlemleri uygulanmasına dair talimatları içeriyor
- Bu önlem, Avrupa Birliği Uçuş Emniyeti Ajansı (EASA) tarafından Acil Uçuşa Elverişlilik Direktifi (Emergency Airworthiness Directive) olarak resmîleştirilecek
Uçuş etkisi ve yanıt
- Airbus, bu önlemlerin yolcu ve müşterilerin operasyon takviminde bazı gecikmeler veya aksaklıklar yaratabileceğini kabul ediyor
- Şirket, uygulamaları hayata geçirmeye destek vermek için havayolu operatörleriyle yakın iş birliği içinde çalışmaya devam edecek ve güvenliğin en üst önceliği olarak kalmasını sürdürecek
- Airbus, yarattığı rahatsızlıktan dolayı özür diledi
İlgili materyaller
- Basın bülteni ile aynı içeriğe sahip bir PDF belgesi (126.02 KB) sağlanıyor
- Belge başlığı: Airbus update on A320 Family precautionary fleet action
- İndirme bağlantısı resmi sitede paylaşıldı
1 yorum
Hacker News görüşü
Bu sorunun tam olarak hangi mikrodenetleyici ailesinde bulunduğunu gerçekten merak ediyorum
Eğer bu, lockstep, ECC vb. kullanan bir safety processor ise, ECC’nin algılayamayacağı türden bit flip’ler yaşanmış demektir
Eğer bu veri bozulmasıysa, basit bir yeniden başlatmadan ziyade tek bir word içinde birden fazla bitin aynı anda ters dönmüş olması da mümkün
Ortam özellikle farklı değilse, voltaj marjı gibi şeyler azaltılmış da olabilir
Bunun NVM mi yoksa SRAM mi olduğunu da merak ediyorum
Bu bir MCU değil, birden fazla çipten oluşan bir sistemdi ve 90’larda tasarlanmıştı; EDAC’in eklendiği yeni donanım sürümü ancak 2002’de çıktı
Böyle bir durumda bit flip’lerin yaşanmış olması gayet mümkün
Ayrıntılar ATSB raporunda yer alıyor
Özellikle xenon flaş sorun yaratıyordu
İlgili örnekler forum gönderisinde, ek tartışmada, resmî blogda, YouTube videosunda görülebilir
Uydular A320’den çok daha yüksek irtifada çalışır ve çoğu Triple Modular Redundancy kullanır
TMR açıklaması, SEU kavramı incelenebilir
NASA insanlı uçuşlarda N değerini 5’e çıkarır
Cache’i tamamen devre dışı bırakmak ya da ECC RAM’i sürekli refresh etmek gibi yöntemler de vardır
Dijital devrelerde latch-up oluşmasını önleyen donanımsal önlemler de mevcuttur
Bilgisayar sektöründe uzun süre kalınca bu tür bit flip vakalarını birkaç kez görüyorsunuz
ECC çoğu zaman kurtarıyor ama bazen yazılım da anormal değerleri tespit edip yok sayacak şekilde tasarlanıyor
Gerçek zamanlı ve güvenlik kritik sistemlerde hata doğrulaması için birden fazla sistem oylama yöntemiyle karar verebiliyor
90’larda CPU cache line bit flip’i yüzünden aylarca uğraştığımı hatırlıyorum
Büyük ölçekli trafiği işleyen bir serviste enum türü değerleri özetliyorduk ve imkânsız bazı değerler bulduk
String’in tam olarak tek bit farkla yanlış kaydedildiğini görünce, bunun kozmik ışınlar kaynaklı olabileceğini düşündük
Aslında yeniden üretilebilen bir bug olmasına rağmen, kernel’den sürücüye ve istemciye kadar her şeyi suçladıktan sonra kendi hatasını kabul etmişti
Yine de dahiydi ve bu A320 olayı konusunda belki de gerçekten haklıydı
The Aviation Herald içinde daha teknik ayrıntılar var
“Bu zafiyet en kötü durumda kumanda edilmemiş elevator hareketine yol açarak uçağın yapısal sınırlarını aşmasına neden olabilir”
Havacılık ve uzay sektörü uzun zamandır bit flip önlemleri geliştiriyor
Airbus/Thales’in bu düzeltmesi, hata kontrollerini güçlendirme ve sorunlu bileşeni otomatik olarak yeniden başlatma yaklaşımına dayanıyor
Ayrıntılar BEA raporunda yer alıyor
Bunda biraz BoFH tarzı bir hava var
“Cuma sabahı erkenden işe geldim, telefon çaldı. Mazeret listesine baktım ve karşımda ‘solar flare’ bana bakıyordu…”
Bağlantı
Bu olayın nasıl teşhis edildiğini merak ediyorum
FDR’nin (uçuş veri kaydedicisi) düşük seviyeli hataları da kaydedip kaydetmediğini, yoksa sadece yüksek seviyeli giriş değerlerini mi sakladığını bilmiyorum
Eğer bu radyasyon kaynaklı bir bit flip ise, bunu nasıl fark ettiler?
Ana uçuş bilgisayarları arasında bir oylama hatası gibi bir şey kaydedilmiş olabilir mi, onu da merak ediyorum
Benzer bir SEU (single-event upset) vakasına dair çok iyi bir olay sonrası analiz raporu var
Tepki biraz “güneşe fazla yakın uçmuş” şakası gibi
Böyle bir durumda tüm filoyu yere indirmek gerekir mi emin değilim
Eğer bu, yıllar içinde on binlerce uçakta bir kez yaşanan bir olaysa, iki aylık bir süre tanıyıp sonra düzeltmek de yeterli olmaz mı diye düşünüyorum
Çözüm ya downgrade etmek ya da önceki sürüm donanımla değiştirmek
Airbus açısından yere indirme kararının doğrudan kaybı sınırlı olur ama bir kaza olursa itibar ve dava riski çok daha büyüktür
“Biz proaktif davranıyoruz, rakibimiz ise ancak kazadan sonra harekete geçiyor” diyebilirler
Basındaki haberlere göre bu adım bir yazılım güncellemesi geri alma işlemi
Asıl güncellemenin amacının ne olduğunu ve uçuş bilgisayarı yazılımının ne sıklıkla güncellendiğini merak ediyorum