Аварийное восстановление с помощью vCloud Availability 3.5

Инфраструктура в облаке предлагает массу преимуществ – мобильность, удаленное подключение, быстрая масштабируемость, снижение издержек – вот лишь некоторые из них. И многие компании уже смогли их оценить. По результатам исследования IDC, в прошлом году рынок облачных услуг России, включающий частные и публичные облака, вырос на 26,9%.

Облачные технологии, несмотря на очевидные преимущества, пока имеют и ряд недостатков. И одним из наиболее значимых из них является потеря контроля над информацией – когда все данные находятся в облаке, у вас нет их физической копии. В случае серьезной кибератаки или сбоя в работе какого-либо конкретного алгоритма облачной среды, существует риск того, что данные окажутся утеряны безвозвратно, и спасти их не удастся.

Чтобы подобные сценарии стали невозможными, была внедрена услуга аварийного восстановления или Disaster Recovery-as-a-Service (DRaaS). В основе сервиса – продукт vCloud Availability от VMware. В публичных облаках vCloud Availability обеспечивает асинхронную репликацию, восстановление после сбоев и миграцию vApp или виртуальных машин.

vCloud Availability предоставляет собой решение, которое позволяет существующему облачному узлу иметь постоянный канал репликации с облачным узлом, доступным в совершенно другой среде (как физически, так и логически), в результате чего, в случае любой катастрофы на основном узле пользователь может развернуть тот же самый ресурс на основе данных, доступных в среде репликации. И все это максимально оперативно. Это основная задача решения. Также оно предоставляет возможности для миграции ресурсов.

VMware vCloud Availability – концепция решения и установка

vCloud Availability представляет унифицированную архитектуру для аварийного восстановления и миграции. С помощью vCloud Availability (VCAV) провайдеры и их клиенты могут осуществлять миграцию и защищать свои vApp и виртуальные машины.

В этой статье мы рассказываем о концепции on-premise и облачной площадках. Речь идет об инфраструктуре клиента с установленным vCenter для мониторинга и управления различными виртуальными машинами, на которых выполняется передача данных. Облачная площадка должна представлять собой среду репликации, в которой для успешного выполнения процесса должны быть установлены vCenter и vCloud Director.

Четыре возможных варианта использования:

  • on-premises vCenter Server – vCloud Director

  • vCloud Director – on-premises vCenter Server

  • С одного vCloud Director на другой vCloud Director

  • Сочетание развертывания «облако-облако» и «on-premises – облако»

Также необходимо установить устройства инфраструктуры VCAV. Они доступны в формате OVF и могут быть загружены непосредственно с сайта VMware. Установка должна производиться в vCenter вашей среды, в результате чего будет сформирована ВМ с предустановленной ОС 'Photon'.


vcloud-availability-1.png


vcloud-availability-2.png

Архитектура и конфигурация vCloud Availability

Прежде чем мы продолжим настройку устройства в нашей среде, очень важно понимать, что лежит в основе этой же архитектуры. Для теста возьмем пример настройки между площадкой клиента и площадкой в облаке, где будут реплицироваться ВМ.

Архитектура решения:

vcloud-availability.png

Из схемы видно, что on-prem в основном состоит из двух компонентов VCAV:

  • vCloud Availability Replicator

  • vCloud Availability Tunnel

В облачной среде совместно работают следующие службы, поддерживающие репликацию, безопасную связь и хранение реплицируемых данных:

  • vCloud Availability Replicator

  •  vCloud Availability Replication Manager

  •  vCloud Availability vApp Replication Manager

  • vCloud Availability Portal

  • vCloud Availability Tunnel

Рассмотрим каждый компонент в отдельности:

vCloud Availability Replicator: функция этого компонента заключается в том, чтобы просматривать vCenter и постоянно отслеживть его состояние. Компонент также отвечает за каждую входящую/исходящую репликацию или миграцию из vCenter.

vCloud Availability Replication Manager: отслеживание состояния репликатора и ведение записей для всех репликаций. Кроме того, он прослушивает vCenter для проверки иерархии репликаций.

vCloud Availability Portal: Функция компонента в том, что он будет напрямую взаимодействовать с соответствующим vCloud Director для управления всеми входящими/исходящими репликациями. Также он управляет менеджером репликаций.

vCloud Availability Tunnel: туннель – это как шлюз для входа и выхода из среды vCloud Availability. Весь трафик, который входит или выходит проходит через туннель.

Как работает аварийное восстановление

vcloud-availability-4.png

Так выглядит ваш рабочий экран. В основном все операции будут выполняться с него.

vCloud Availability предлагает две основные услуги: миграция и защита.

vcloud-availability-5.png


Миграция: выбранный ресурс полностью перемещается из одной среды в другую.

Защита: выбранный ресурс постоянно реплицируется в другой среде по заданной скорости RPO.

Опция защиты подразделяется на Failover, Test Failover и Reverse.

Failover: это действие приводит к остановке репликации ресурсов между средами и вызывает новый VM/vApp из реплик, доступных в облачной среде. И вновь созданная ВМ/vApp будет действовать в качестве основной с этого момента. Это действие выполняется в случае катастрофы, затронувшей нашу основную среду.

Test Failover: действие для проверки правильности выполнения миграции. Если что-то не так, это действие выдаст сообщение об ошибке.

Reverse: опция становится доступной после того, как определенный ресурс полностью отказал. При включении этой опции отказоустойчивый ресурс, действовавший в качестве основного, должен начать посылать репликацию в свое исходное окружение. Это делается после того, как будет устранена авария, и среда on-prem находится в стабильном состоянии. 

Предварительные условия:

В своем vCloud Director создайте организацию и назначьте ей права на создание и редактирование ВМ/vApps. Убедитесь, что vMotion включена в обоих vCenters.

Процедура

После выбора любого из вариантов защиты или переноса необходимо выбрать ресурс, на котором будет выполняться операция. Далее выбираем целевой VDC, когда будет происходить репликация/перемещение. После этого выбираем параметры – время RPO, которое определяет временной интервал, после которого будет сделан один снэпшот; политику хранения (если таковая имеется).

vcloud-availability-8.png

Мы также можем выбрать количество экземпляров, которые могут быть сохранены в течение определенного периода времени, чтобы у нас был определенный объект восстановления в определенный момент времени для выбора и восстановления. Во избежание неполноты данных предлагается сохранить Quiescing.

 

Как сделать откат в vCloud Availability 3.5

До vCloud Availability 3.0 существовала конкретная опция отката. В обновлении 3.5 этой функции нет. Откат выполняется следующим образом:

После включения опции Reverse мы обнаружим, что VM/vApp перешла на вкладку исходящей репликации на облачной площадке. Если мы выберем эту опцию и инициируем другой процесс восстановления, то ресурс будет возвращен в исходное состояние.

Дополнительные возможности vCloud Availability

  1. Вы можете нажать на 'Sync' в любое время, чтобы репликация состоялась, следующая репликация произойдет в выбранное время RPO, начиная с этого конкретного времени синхронизации.

  2. Когда время RPO будет достигнуто, ваша последняя запись на ресурсе в данном конкретном экземпляре будет реплицирована. Все остальное, даже данные, поступившие во время репликации, будут реплицироваться в следующем цикле RPO.

  3. Прежде чем выполнять восстановление после сбоя, мы можем выбрать опцию 'Сети (Networks)', чтобы настроить состояние сети в новой среде. Однако эта функция все еще не совсем стабильна в использовании и часто выдает множество ошибок.

  4. Создавайте отдельные политики в закладке политики для назначения определенных разрешений на репликации.

  5. Можно генерировать и загружать лог-файлы пакета из вкладки "Поддержка" для дальнейшей отладки и устранения неисправностей.


Для инфраструктуры, реализованной на базе технологии виртуализации VMware, такое решение аварийного восстановления – простой и доступный способ обеспечения катастрофоустойчивости виртуальных машин. Решение отлично подойдет компаниям, которым необходима гарантия доступности сервиса даже в случае отказа физических серверов.

Несмотря на то, что vCloud Availability 3.5 не идеальный пакет, и еще есть много возможностей для усовершенствования, все же справедливо отметить, что для DRaas, он работает. Скоро мы увидим, что нас ждет в версии 4.0.


Вверх!