Управление риском - часть деятельности системного администратора. Основные риски, которые нас касаются, связаны с невыполненным обслуживанием, подклассом которого является потеря данных. Один из основных способов, при помощи которых системные администраторы управляют риском, - это создание резервных копий. Резервные копии являются элементом стратегии смягчения рисков, защищающим от потери данных и невыполненного обслуживания. В главе 25 мы более подробно рассмотрим, как различные технологии, такие как КАГО, помогают нам смягчить риск невыполненного обслуживания из-за потери данных. Первые шаги по управлению риском - это выявление рисков и количественная оценка рисков. На какие системы и службы может повлиять изменение? Каковы наихудшие возможные сценарии развития событий? Скольких ваших пользователей могут затронуть эти сценарии? Это помогает разделить машины по профилям использования, таким как инфраструктурные машины, серверы подразделения, критичные для бизнеса, или рабочие станции, и подсчитать количество машин, на которые влияет изменение.
Следующий шаг после оценки риска изменения - определить, как смягчить риск. Смягчение имеет пять основных компонентов. Первый из них - провести консультацию по изменению: касается ли это изменение удовлетворения потребностей бизнеса, влияет ли он на другие события и изменения, когда оно должно быть реализовано? Второй - это план тестирования: как оценить, было ли изменение успешным? Третий - план отмены: как вернуть старую службу или систему, если изменение не было успешным? Четвертый компонент - момент решения: как и когда нужно принимать решение о реализации плана отмены? Последний компонент - это подготовка: что вы можете сделать и проверить заранее, чтобы убедиться, что изменение проходит плавно и в минимальные сроки?
Важно заранее решить, при каких условиях обновление системы будет полностью остановлено. Остановка должна обеспечить достаточное время для реализации плана отмены до того, как служба снова должна начать работать. Время, к которому служба снова должна начать работать, может быть основано на обязательстве перед пользователями, потребностях бизнеса или обусловлено тем, что данное изменение является элементом большей последовательности изменений, которые будут затронуты, если служба не будет вовремя восстановлена.
Точка принятия решения часто является самым сложным элементом для системного администратора, который вносит изменение. Мы часто считаем, что можем потратить «еще только 5 минут», чтобы все заработало. Часто полезно, чтобы другой системный администратор или руководитель разделял вашу ответственность и обеспечивал, чтобы план отмены был реализован по графику, если изменение было неудачным.
В идеальном случае лучше всего внести и проверить изменение заблаговременно в тестовой лаборатории. Также может быть возможность заранее внести изменение на дополнительной машине, которой можно заменить нужную машину. Однако тестовые лаборатории и дополнительные машины - это роскошь, которую не все компании могут себе позволить, а некоторые изменения непригодны для тестирования в лабораторной среде.
Опубликовал Kest
April 04 2012 21:35:50 ·
0 Комментариев ·
4149 Прочтений ·
• Не нашли ответ на свой вопрос? Тогда задайте вопрос в комментариях или на форуме! •
Комментарии
Нет комментариев.
Добавить комментарий
Рейтинги
Рейтинг доступен только для пользователей.
Пожалуйста, залогиньтесь или зарегистрируйтесь для голосования.
Нет данных для оценки.
Гость
Вы не зарегистрированны? Нажмите здесь для регистрации.