DISASTER RECOVERY

Caso de éxito

La continuidad en el negocio o la recuperación de los sistemas informáticos ante desastres es una de las mayores preocupaciones de las empresas.

Hay dos parámetros fundamentales para definir un plan ante un desastre total: la replicación y la recuperación.

 

Replicación Síncrona o Asíncrona

La replicación de dos centros de datos puede ser síncrona o asíncrona. Una replicación es síncrona cuando no hay diferencia entre los datos ubicados en el centro principal y el centro o centros secundarios. La replicación síncrona se puede dar con mayor facilidad en centros de datos unidos por LAN, mediante fibra o cobre según las distancias, la replicación asíncrona se da cuando falla la replicación síncrona y cuando los centros de datos están unidos por WAN, mediante ADSL o comunicaciones de operadores tipo fibra o similar.

La recuperación es la puesta en marcha. Si es necesaria la intervención humana (de un operador que debe poner en marcha una máquina virtual, por ejemplo) es una recuperación pasiva, si se pone en marcha de forma automática sin necesidad de intervención humana se denomina activa.

El caso de éxito de VMware Fault Tolerance es un sistema síncrono activo-activo por LAN, ya que no hay diferencia de datos y se pone en marcha un segundo CPD de forma automática en caso de desastre total del CPD principal.

En este caso vamos a detallar una instalación asíncrona activa-pasiva por WAN. En el CPD principal hay instalados tres servidores Intel con VMware vSphere Essentials Plus unidos por Fibre Channel a una cabina EMC VNX5200.

Esta cabina de discos incluye un paquete de software de forma gratuita denominado VNX Software essentials Pack.

Uno de los programas incluidos es EMC RecoverPoint for Virtual Machines que es una solución operacional y de recuperación de desastres para aplicaciones virtualizadas en ambientes VMware. Ofrece replicación basada en hipervisor local y remota, protección de datos continua para la recuperación por máquina virtual en cualquier punto en el tiempo, y coordinación de recuperación de desastres automatizada e integrada para hasta 15 máquinas virtuales.

Este CPD virtual está unido y securizado a un secundario con la tecnología de Sophos Firewall XG mediante una WAN por fibra de 300 Mb. simétricos donde está ubicada una segunda cabina EMC VNX5200.

La réplica de las 15 máquinas virtuales se realiza en menos de 4 minutos en un periodo de réplica establecido de 15 minutos, por lo que en caso de desastre total la cantidad de trabajo y datos que se pueden llegar a perder es de un máximo de entre 4 y 15 minutos. Circunstancialmente se podría dar el caso de no perder ningún dato.

Las tablas de conexiones de las diferentes delegaciones a la VPN que realiza el Sophos XG están también replicadas en modo pasivo por lo que en caso de desastre general las VPN se podrían en marcha en el segundo CPD en menos de 5 minutos. La puesta en marcha de las 15 máquinas virtuales se realiza en un tiempo de 45 minutos por lo que poner en funcionamiento el segundo CPD llevaría unas 2 horas.