Wayne Hale ostrzega

Bardzo słuszne ostrzeżenie – w momencie kiedy dwa razy się nie udało odliczanie a do tego wiadomo że jak się tym razem nie uda to następny start dopiero w sierpniu (a co za tym idzie odszkodowania dla klienta itp.), trudno zachować procedury i wymaganą jakość. Trochę się martwię o SpaceX. Ten start jest dla nich niezwykle ważny. I już pokazali że udało im się czegoś nie dopilnować dwa razy. Co będzie za trzecim razem? Czy staną na wysokości zadania? Ryzyko jest olbrzymie. Teoretycznie firma powinna zdemontować ładunek, postawić rakietę na platformie i zrobić następny test statyczny żeby wyeliminować potencjalne problemy. Chyba że problem jest z podsystemami który monitoruje ładunek – wtedy i dziesiątki testów statycznych nie będą w stanie go wykryć. 

Współczuje pracownikom SpaceX – dziś cała Ameryka świętuje a oni pewnie pracują non-stop od wczoraj. Zanim rozpoczną następne odliczanie jutro rano, muszą być w 100% pewni że wszystko jest OK. Trzecie zatrzymanie odliczania było by katastrofą. O najgorszym nawet nie wspominam bo jako człowiek nie wierzący w przesądy nie chce zapeszyć 🙂

Nie wiem ilu z was ma doświadczenie w walce z błędami w systemach informatycznych – znalezienie powodu awarii jest zawsze najtrudniejsze. Jak już znamy powód to jego usunięcie jest zazwyczaj relatywnie łatwe, choć zdarzają się wyjątki od tej reguły. A jak problem jest gdzieś na pograniczu sprzętu i oprogramowania to znalezienie go jest szczególnie trudne. Innym typowym problemem w systemach informatycznych jest stworzenie całej gamy nowych, trudnych do wykrycia problemów w wyniku pospiesznej i niedokładnie przemyślanej naprawy oryginalnego problemu. To typowe w skomplikowanych systemach, w których zależności czasowe są bardzo ważne. 

Dlatego wszyscy czytelnicy proszeni są (nie wierzę w przesądy!) o trzymanie kciuków za inżynierów SpaceX by udało im się znaleźć powód wczorajszego abortu i go zlikwidować nie tworząc przy okazji innych problemów. 

Marek Cyzio Opublikowane przez: