We rise up for the things we believe in over and over again
В прошедшую субботу мог бы влететь, что называется, на все деньги да еще и с ноги. Но обошлось. И спасло меня лишь то, что по счастливой случайности я еще раз прямо перед началом работ прочитал письмо о том, кому и по какому телефону нужно позвонить и согласовать цепочку действий. А дело вот в чем.

На субботу запланировали работы по питанию на одной из площадок. Ну запланировали и ладно, потушим оборудование, дождемся, когда питание снова дадут, после чего я дам отмашку нашему коллеге, который на площадке будет ждать, и он все запустит.

Придя на работу в субботнее утро я уже открыл все необходимые оснастки, выбрал в них группу серверов площадки, и приготовился тушить. Да только вспомнил, что надо ж позвонить кое-кому. А вот телефон этого кое-кого я забыл (плохая у меня все же память в последнее время, и ковид тут ни при чем). Открываю ранее присланное письмо, вожу по нему глазами, нахожу номер телефона, и одновременно взгляд цепляется за название площадки, которую нужно будет погасить. Протираю глаза еще раз, читаю внимательно то, что написано, потом перевожу взгляд на выбранную группу серверов и понимаю, что был буквально в одном шаге от минимум выговора с занесением, потому что сервера те принадлежат к другой площадке, тушить которую просто никак нельзя.

Получается, что я все утро ехал с мыслью о том, что нужно тушить другую площадку, а не запланированную. И чуть было ее не потушил. Но не потушил. Повторюсь - обошлось.

В чем мораль истории? А она довольно проста. Чек-лист. Эта штука просто обязана быть составленной заранее (может быть даже сильно заранее), и этот самый чек-лист нужно внимательнейшим образом прочтитать перед началом работ, а не во время, или даже после. Сбережет очень много нервных клеток.

@музыка: Haloweak - Nona Ouroboros

Комментарии
03.08.2021 в 00:12

Я занимаюсь не администрированием, а программированием. Часто программирование бывает "безответственным" -- запускай отладку, и будь что будет. Там разберёшься, когда отработает. Но иногда отладка связана с чем-то реальным, "в железе", и тогда просто так запускать никак нельзя. Сначала надо подумать, какие могут быть последствия в самом плохом случае. Потом подложить соломки во все эти места. И только потом запускать. И тут чек-лист получается довольно своеобразный, поскольку его надо каждый раз составлять заново
03.08.2021 в 01:11

We rise up for the things we believe in over and over again
Везде свои подводные камни :)
03.08.2021 в 22:11

Тотальная неудачница и убийца жёстких дисков.
Напомнило факап Гитлаба, когда админы перепутали терминалы.
03.08.2021 в 23:19

We rise up for the things we believe in over and over again
Линда Кайе, примерно так, да. Хотя последствия не такие разрушительные для конторы, но весьма плачевные для виновника "торжества" )