3 апр. 2012 г.

На авось

Снова история. Снова крупное предприятие парализовано на полдня с перспективой повторного ввода всей информации за несколько дней. И все по причине элементарной безалаберности:
  • Мало купить бесперебойник — надо подключить к нему сервер.
  • Мало подключить сервер к бесперебойнику — надо убедиться, что мощности последнего хватит, чтобы продержать сервер достаточное время для корректного завершения всех задач и выключения операционной системы.
  • Обратная связь должна быть настроена и специальная утилита должна следить за обрывом питания и выключать сервер по прошествии некоторого времени.
  • Аккумуляторы источника бесперебойного питания деградируют со временем. Проверять их работоспособность следует не реже 2-3-х раз в год.
  • Предыдущее утверждение справедливо и для батарейки на RAID контроллере, которая обеспечивает энергонезависимость кэш памяти. Следите за сообщениями при загрузке сервера и регулярно проверяйте лог операционной системы.
  • Мало регулярно делать архив базы, надо также регулярно проверять восстанавливается ли база из этого архива.
  • Архив базы данных в десятки гигабайт будет восстанавливаться часами. Всегда следует держать на резервном сервере горячую копию, выполненную с помощью утилиты nbackup или SQL командами ALTER DATABASE BEGIN BACKUP, ALTER DATABASE END BACKUP.
  • И последнее, но от этого не менее важное: резервный сервер должен быть.

Комментариев нет:

Отправить комментарий