1 puan yazan GN⁺ 2023-11-29 | 1 yorum | WhatsApp'ta paylaş

500 Milyon Dolarlık Mars Rover Hatası: Benim Başarısızlık Hikâyem

  • 2003 Şubat'ında, NASA'nın Jet Propulsion Laboratory (JPL) merkezinde sıradan bir akşam başlıyordu.

  • Spirit Mars rover'ının fırlatma için Florida, Cape Canaveral'a taşınmasına iki hafta kalmıştı.

  • Spirit ve Opportunity, o dönemin en karmaşık uzay araçlarından ikisiydi ve NASA bu projeye neredeyse 1 milyar dolar yatırım yapmıştı.

  • Mars rover'ında tekerlek tahriki ve yönlendirme, robot kol kontrolü, kamera hedefleme ve Dünya'ya dönük anten yönlendirmesi gibi işler için 62 motor bulunuyordu.

  • Rover, Mars'ın zorlu ortamını simüle eden kapsamlı testlerden geçti.

  • Özellikle, patlayıcı şok dalgalarının motorların içindeki hassas karbon bileşenlere zarar verebildiği piroteknik olaylar kritik öneme sahipti.

  • Motorların iç durumu, elektriksel performansları kontrol edilerek doğrulanabiliyordu.

  • Testler birçok kez yapılmıştı ve deneyimli Chris, motor bağlantıları ile kontrol talimatlarını hazırlamaktan sorumlu kişi olarak bu test kampanyası için en uygun isimdi.

  • Test sırasında Chris, elektriksel dalgayı yanlışlıkla rover yerine uzay aracına gönderme hatasını yaptı.

  • Bu hata, 500 milyon dolarlık uzay aracının hurdaya çıkmasına yol açabilecek bir durum yarattı.

  • Chris durumu hemen bildirdi, ancak uzay aracından gelen tüm telemetri kaybolmuş görünüyordu.

  • Chris, kendi hatası yüzünden bu fırlatma döngüsünde yalnızca bir rover'ın gönderilebileceğini düşündü.

  • O gece bunu eşine anlattı ve ertesi gün işini kaybedeceğinden emindi.

  • Ertesi gün ekip olayı ayrıntılı biçimde inceledi ve elektriksel dalganın büyük olasılıkla H-bridge motor sürücü devresine gitmiş olabileceğine karar verdi.

  • Uzay aracını yeniden açmayı ve testlere devam etmeyi seçtiler.

  • Uzay aracının telemetrisi geri geldi ve Spirit'in ölmediği ortaya çıktı.

Dersler

  • Chris bu hikâyeyi paylaşarak hem kendisine hem de başkalarına değerli dersler sunuyor.

  • Bu başarısızlık hikâyesi, ekip kültürü ve işe alım sürecinde de önemli bir rol oynuyor.

  • Chris, deneyiminden çıkardığı dersi şöyle ifade ediyor: "Yaralarının sana hizmet etmesine izin ver; onlar değerli öğrenme deneyimleridir ve yetkinlik ile dayanıklılığa yapılmış bir yatırımdır."

  • Kriz anında bir meslektaşı Chris'in yanına gelip onu teselli etti ve bir dahaki sefere bir şeyin sorun olmadığını onaylarken bu hissi hatırlamasını söyledi.

  • Chris bu olaydan sonra Spirit ve Opportunity'nin uçuş direktörü oldu ve NASA'nın Exceptional Achievement Medal ödülünü aldı.

  • Proje yöneticisi, Chris'in aynı hatayı bir daha yapmayacağına inanarak testleri yürütmeye devam etmesine karar verdi.

  • Chris daha sonra da birçok test gerçekleştirdi ve aynı hatayı tekrarlamamak için prosedürleri dikkatle güncelledi.

  • Ne zaman önemli bir karar verse o anı hatırladığını, ayrıca başkalarının kendi zorlu anlarını aşmasına yardımcı olmaya odaklandığını söylüyor.

  • Uzay keşfinde başarısızlık bir seçenek değil, sistemin içine gömülü bir gerçektir; her hata daha büyük başarıya giden bir basamaktır.

  • Chris, uzay girişimcileri, mühendisler, bilim insanları ve teknisyenler gibi başkalarının da "başarısızlık hikâyelerini" dinlemek ve onlardan öğrenmek istiyor.

GN⁺ Yorumu

Bu yazıdaki en önemli nokta, başarısızlık yoluyla öğrenme ve büyümenin değeridir. Chris'in hikâyesi, başarısızlığın kaçınılmaz bir parça olduğunu kabul etmenin ve onu aşma sürecinde edinilen derslerle özgüvenin ne kadar önemli olduğunu gösteriyor. Bu yazı özellikle kariyerinin başındaki yazılım mühendislerine, başarısızlıktan korkmadan onu bir gelişim fırsatı olarak görmeleri için ilham veriyor. Ayrıca Chris'in deneyimi, ekip çalışması ve liderliğin önemini vurgularken, zor durumlarda birbirini destekleyen ve güvenen bir kültürün ne kadar kıymetli olduğunu da gösteriyor. Bu tür hikâyeler; faydalı, olumlu, ilgi çekici, eğlenceli ve etkileyici unsurlar taşıdığı için birçok insanın ilgisini çekecektir.

1 yorum

 
GN⁺ 2023-11-29
Hacker News yorumları
  • Makine/havacılık mühendisi deneyimi

    İnsan hayatından sorumlu bir güvenlik incelemecisi olarak, bir kazada hasar gören parça fotoğraflarını incelerken bunun kendi hesaplama hatasından ya da yetersiz test prosedürlerinden kaynaklanmış olabileceğinden korkuyor. Bu tür deneyimler bazı kişilerde PTSD benzeri psikolojik yükler bırakabiliyor.

  • Yazılım mühendisinin hata hikayesi

    10 yıl önce, bir müşterinin web servisinin yeni sürümünü yayına alma gününde, manuel ve karmaşık dağıtım süreci sırasında yanlışlıkla production veritabanını sildi. Neyse ki yedekler sayesinde verilerin büyük kısmı kurtarılabildi. O günden sonra veritabanları ve production sistemlerle çalışırken son derece dikkatli davranıyor.

  • Stajyer hatası ve süreç sorunu

    Eğer bir stajyer production veritabanını sildiyse, bu stajyerin değil sürecin sorunudur. Tam zamanlı çalışanlardan (FTE) daha fazlası beklense de, hatalardan sonra yeniden ayağa kalkabilme umudunun önemini kabul ediyor.

  • Veritabanı güvenliği ve hacker tehdidi

    Tek bir kişinin hatası tüm sistemi çökertmeye yetebiliyorsa, aynı risk hacker'lar için de geçerlidir. Ayrı kimlik bilgileri, erişim ayrımı ve tehlikeli komutların yasaklanması gibi güvenlik önlemleri önemlidir.

  • TV yayın istasyonunda bant operatörü deneyimi

    Yayın sırasında yanlış bandı çıkarmak gibi hataları önlemek için eğitmenin yaptığı uyarılar sayesinde dikkatli olmayı öğrendi. Hatalara verilen disiplin cezaları sertti ama bu sayede hata yapmadan kariyerini sürdürebildi.

  • Thomas J. Watson alıntısı

    Şirkete büyük zarar verdiren bir çalışanı işten çıkarmak yerine, o deneyimden öğrenilenleri değerli buluyor.

  • Olaylar arasındaki bağlantının önemi

    Bir olay yaşandığında, doğru timestamp karşılaştırması gereksiz endişeleri önleyebilir. Doğru dil kullanımı ve olaylar arasındaki bağlantının doğrulanmasının önemini vurguluyor.

  • NOAA-N Prime uydu kazası

    Pahalı cıvatalar başka bir projeye "ödünç" verilip geri getirilmediği için uydunun düşmesine yol açan bir kaza yaşandı. Kazanın onarım maliyeti 135 milyon dolara ulaştı.

  • Aşırı çalışma ve hata olasılığı

    Kritik işler için 12 saatlik mesailere izin vermek yanlıştır. Hata olasılığını kabul etmek ve yalnızca insan kapasitesine güvenmenin riskli olduğunu kabul etmek gerekir.

  • Elektrik konnektörü tasarımı ve motor kontrol cihazlarının karmaşıklığı

    Yanlış bağlantıları önlemek için farklı boyut ve şekillerde konnektörler kullanan tasarımın önemi vurgulanıyor. Karmaşık hata zincirleri ve bunun sonucunda yeniden tasarım gerekliliği kabul ediliyor.