5 вещей, которые разработчики не могут сказать своим клиентам в случае сбоя производства | Журнал "Вольт"
Пн. Окт 26th, 2020


Адаптированный перевод «5 истин, которые инженеры не могут сказать своим клиентам во время простоя производства».

Мой подарок на день рождения в этом году был производственной ошибкой.

Кто-то в день рождения ест мороженое, кто-то планирует увлекательное путешествие. Вместо поездки у меня отключили электричество. И это было совсем не весело.

Пытаясь разобраться с ситуацией, мы с коллегой потихоньку ворчали, выражая недовольство тем, насколько сложно найти источник проблемы. Помимо непосредственного решения проблемы, нам еще нужно было наладить максимально эффективное общение с затронутым клиентом.

Клиенту нужно было знать, что мы все исправим и быстро, и что это больше не повторится.

Мы отправляли ему электронные письма, стараясь быть максимально тактичными, и успокаивали его по телефону. Мы часто сообщали о прогрессе и обеспечивали необходимую степень прозрачности и технической осведомленности.

Но вот несколько истин, которые мы просто не могли сказать клиенту.

1. Мы не были готовы к этому

Как и многие другие разработчики во многих других проектах, мы унаследовали это приложение. В итоге мы получили небольшой объем документации и плохие инструменты для отладки. И в этом приложении было так много движущихся частей, что невозможно было сосчитать.

Это похоже на попытку потушить лесной пожар огнетушителем.

Отведенное время и бюджет не позволяли нам хорошо подготовиться к возможному провалу производства, и теперь нам пришлось лихорадочно искать выход. Мы были к этому не готовы во многом.

2. Неисправность может быть вызвана любой из 20 причин.

В чем причина перебоев в работе? Может дело в сервере. Или, может быть, в коде. Это может быть база данных или сторонний пакет. Возможно пищевое отравление. Может это наша вина. А может твое.

Как решить эту проблему? Может просто потребуется перезагрузка. Возможно, необходимо обновить пакет или настройку конфигурации. Или вам понадобится Пепто-Бисмол (лекарство от несварения желудка – прим. Ред.). Возможно, вам придется сжечь все это к черту и начать все сначала.

3. Мы не знаем, сколько времени потребуется, чтобы все исправить.

Для перезапуска сервера может потребоваться десять минут. Восстановление сервера может занять от десяти часов до десяти дней. Возможно, мы сможем отследить ошибку за несколько минут или никогда не узнаем, что на самом деле произошло.

Все зависит от причины поломки, а мы уже установили, что у нас есть 20 (и более) вариантов причин. Мы также обнаружили, что не готовы к этому.

Вы можете просто оставить нас в покое и поверить, что мы очень стараемся решить проблему как можно быстрее.

А пока мы предлагаем вам пересмотреть свое определение слова «быстро».

4. Чтобы выяснить причину сбоя, нам нужно, чтобы проблема появилась снова.

Поскольку у нас мало инструментов и документации, мы в основном слепы. К счастью, мы уже установили несколько инструментов мониторинга – это нам поможет.

Но дело в том, что эти инструменты могут только следить за развитием событий. Следовательно, чтобы диагностировать проблему, нам нужно, чтобы она появилась снова.

Конечно, мы могли бы проводить эти эксперименты в промежуточной или тестовой среде (и мы это делали), но там не возникают те же проблемы, которые возникали в производственной среде. И это в целом логично, ведь там все настройки разные.

На данный момент наш единственный вариант – снова позволить производственной системе снова вылететь. Скажите своей команде, чтобы она придерживалась этого, потому что сейчас мы пытаемся не исправить проблему, а, по крайней мере, просто воспроизвести ее. Только так наши инструменты могут уловить происходящее.

5. Вы обязательно должны заплатить нам больше за этот стресс.

Мы не спим. Можно сказать, что мы не едим. Наши семьи не видели нас несколько дней. Мы все время проводим перед компьютером, за исключением коротких походов в холодильник и в туалет (а также в какой-нибудь темный угол, чтобы свернуться калачиком в позе эмбриона).

Такой уровень стресса требует как минимум двойной оплаты. Но мы понимаем, что сейчас не время подписывать новый контракт. Мы все находимся в режиме выживания, и очевидно, что здоровье производства важнее нашего.

Вот почему вы должны платить нам (намного) больше во время чрезвычайной ситуации.

Результат

Это все истины, которые разработчики абсолютно не могут сообщить своим клиентам во время кризиса, связанного с производством.

Если эти мысли приходили вам в голову, просто знайте, что вы не одиноки. Если у вас были подобные чувства, знайте, что другие разработчики думают так же.



Source link

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *