Тестирование восстановления
Тестирование восстановления - это метод тестирования программного обеспечения, который проверяет способность программного обеспечения восстанавливаться после сбоев, таких как сбои программного обеспечения / оборудования, сбои сети и т. Д. Целью тестирования восстановления является определение возможности продолжения работы программного обеспечения после аварии или потери целостности. Тестирование восстановления включает в себя возврат программного обеспечения к точке, где целостность была известна, и повторную обработку транзакций до точки отказа.
Пример тестирования восстановления
Когда приложение получает данные из сети, отключите соединительный кабель.
- Через некоторое время снова подключите кабель и проанализируйте способность приложения продолжать получать данные с точки, в которой было разорвано сетевое соединение.
- Перезагрузите систему, пока в браузере открыто определенное количество сеансов, и проверьте, может ли браузер восстановить их все или нет.
В программной инженерии тестирование восстанавливаемости - это разновидность нефункционального тестирования. (Нефункциональное тестирование относится к аспектам программного обеспечения, которые могут не иметь отношения к конкретной функции или действиям пользователя, например, к масштабируемости или безопасности.)
Время, необходимое для восстановления, зависит от:
- Количество точек перезапуска
- Объем заявок
- Обучение и навыки людей, проводящих восстановительные мероприятия, и инструменты, доступные для восстановления.
Когда имеется несколько сбоев, вместо того, чтобы заботиться обо всех сбоях, тестирование восстановления следует проводить в структурированном виде, что означает, что тестирование восстановления следует проводить для одного сегмента, а затем для другого.
Это делают профессиональные тестировщики. Перед тестированием восстановления соответствующие данные резервных копий хранятся в безопасных местах. Это сделано для того, чтобы работа могла быть продолжена даже после аварии.
Жизненный цикл процесса восстановления
Жизненный цикл процесса восстановления можно разделить на следующие пять этапов:
- Нормальная операция
- Возникновение бедствия
- Срыв и сбой в работе
- Устранение последствий стихийных бедствий в процессе восстановления
- Реконструкция всех процессов и информации для приведения всей системы в нормальный режим работы
Давайте подробно обсудим эти 5 шагов -
-
Система, состоящая из оборудования, программного обеспечения и микропрограмм, интегрированных для достижения общей цели, становится работоспособной для выполнения четко определенной и заявленной цели. Система призвана выполнять нормальную работу для выполнения запланированной работы без каких-либо сбоев в течение установленного периода времени.
-
Сбой может произойти из-за неисправности программного обеспечения по разным причинам, например, из-за сбоя, инициированного входом, сбоя программного обеспечения из-за аппаратного сбоя, повреждения из-за пожара, кражи или удара.
-
Фаза сбоя - это наиболее болезненная фаза, которая приводит к потерям в бизнесе, разрыву отношений, потерям возможностей, потерям человеко-часов и неизменно финансовым потерям и потерям деловой репутации. У каждого здравомыслящего агентства должен быть план аварийного восстановления, чтобы свести к минимуму фазу сбоя.
-
Если план резервного копирования и процессы снижения рисков находятся в нужном месте до возникновения аварии или сбоя, восстановление может быть выполнено без больших потерь времени, усилий и энергии. Назначенное лицо вместе со своей командой с назначенной ролью каждого из этих лиц должно быть определено, чтобы зафиксировать ответственность и помочь организации спастись от длительного периода сбоев.
-
Реконструкция может включать в себя несколько сеансов работы для восстановления всех папок вместе с файлами конфигурации. Для правильного восстановления должна быть соответствующая документация и процесс реконструкции.
Стратегия восстановления
У группы восстановления должна быть своя уникальная стратегия извлечения важного кода и данных, чтобы вернуть работу агентства в нормальный режим.
Стратегия может быть уникальной для каждой организации в зависимости от критичности систем, с которыми они работают.
Возможную стратегию для критических систем можно представить следующим образом:
- Иметь одну резервную копию или более одной
- Чтобы иметь несколько резервных копий в одном или разных местах
- Чтобы иметь онлайн-резервную копию или автономную резервную копию
- Может ли резервное копирование выполняться автоматически на основе политики или вручную?
- Наличие независимой реставрационной группы или самой команды разработчиков, которые могут быть задействованы для работы.
Каждая из этих стратегий имеет связанный с ней фактор стоимости, и несколько ресурсов, требуемых для нескольких резервных копий, могут потреблять больше физических ресурсов или могут нуждаться в независимой команде.
Многие компании могут быть затронуты из-за зависимости их данных и кода от соответствующего агентства разработчиков. Например, если Amazon AWS отключится, он отключит 25 Интернета. В таких случаях решающее значение имеет независимая реставрация.
Как провести тестирование восстановления
При выполнении тестирования восстановления следует учитывать следующее.
- Мы должны создать испытательный стенд, максимально приближенный к реальным условиям развертывания. Изменения в интерфейсе, протоколе, прошивке, аппаратном и программном обеспечении должны быть как можно ближе к фактическому состоянию, если это не то же самое.
- Исчерпывающее тестирование может занять много времени и затрат, необходимо выполнить идентичную конфигурацию и полную проверку.
- По возможности следует провести тестирование оборудования, которое мы, наконец, собираемся восстановить. Это особенно верно, если мы выполняем восстановление на другую машину, а не на ту, на которой была создана резервная копия.
- Некоторые системы резервного копирования предполагают, что размер жесткого диска будет точно таким же, как у того, с которого была сделана резервная копия.
- Устаревание необходимо контролировать, поскольку приводные технологии развиваются быстрыми темпами, а старый привод может быть несовместим с новым. Один из способов решения проблемы - восстановить виртуальную машину. Поставщики программного обеспечения для виртуализации, такие как VMware Inc., могут настраивать виртуальные машины для имитации существующего оборудования, включая размеры дисков и другие конфигурации.
- Системы резервного копирования онлайн - не исключение для тестирования. Большинство поставщиков услуг резервного копирования в Интернете защищают нас от прямого воздействия проблем с носителями за счет использования отказоустойчивых систем хранения.
- Хотя онлайн-системы резервного копирования чрезвычайно надежны, мы должны протестировать систему восстановления, чтобы убедиться, что нет проблем с функцией извлечения, безопасностью или шифрованием.
Процедура тестирования после реставрации
В большинстве крупных корпораций есть независимые аудиторы, которые периодически проводят тесты на восстановление.
Расходы на поддержку и тестирование комплексного плана аварийного восстановления могут быть значительными и могут оказаться непомерно высокими для малых предприятий.
Меньшие риски могут зависеть от их резервных копий данных и планов хранения за пределами предприятия, чтобы спасти их в случае катастрофы.
После восстановления папок и файлов можно выполнить следующие проверки, чтобы убедиться, что файлы восстанавливаются правильно:
- Переименуйте папку с поврежденными документами
- Подсчитайте количество файлов в восстановленных папках и сравните их с существующей папкой.
- Откройте несколько файлов и убедитесь, что они доступны. Обязательно открывайте их в приложении, которое их обычно использует. И убедитесь, что вы можете просматривать данные, обновлять данные или делать то, что вы обычно делаете.
- Лучше всего открывать несколько файлов разных типов, изображения, mp3, документы, большие и маленькие.
- В большинстве операционных систем есть утилиты, которые можно использовать для сравнения файлов и каталогов.
Резюме:
В этом руководстве мы изучили различные аспекты тестирования восстановления, которые помогают понять, соответствует ли система или программа своим требованиям после сбоя.
Эта статья предоставлена Светлой Приядаршини