Alta Disponibilidade e Recuperação de Desastre

Alta Disponibilidade e Recuperação de Desastre

Percebo que muitas pessoas confundem o termo Alta Disponibilidade (High Availability – HA) com Recuperação de Desastre (Disaster Recovery – DR), por isso resolvi escrever este post para esclarecer algumas coisas.

Academicamente falando, HA é a medida da capacidade de um sistema permanecer acessível em caso de falha de software e/ou hardware. Normalmente HA é implementada através da estruturação de vários níveis de tolerância a falhas.

Já o DR é o processo pelo qual um sistema é restaurado para um estado anterior aceitável, depois de um desastre natural ou causado pelo homem.

Ambos aumentam a disponibilidade geral de um ambiente, porém, a diferença básica entre eles é que o HA visa ao máximo garantir que o serviço permaneça ativo, enquanto o DR pode ter uma parada maior no serviço enquanto o plano de DR é executado.

Para facilitar o entendimento, vamos exemplificar esses termos no mundo da virtualização.

Alta Disponibilidade (High Availability – HA)

Imagine que temos um data center contendo um cluster com 4 hypervisors e 100 máquinas virtuais (sendo 25 para cada hypervisor). Caso algum hypervisor tenha um problema físico e fique indisponível, as máquinas virtuais irão reiniciar e serão executadas nos outros 3 hypervisores que restaram no cluster. Neste caso, 25 máquinas virtuais foram afetadas por alguns minutos. Para diminuir o tempo de inatividade é possível, além do HA do hypervisor, criar uma cluster (failover cluster, por exemplo) entre duas ou mais máquinas virtuais e mante-las em diferentes hypervisors do cluster.

Recuperação de Desastre (Disaster Recovery – DR)

Continuando com o exemplo acima, o que aconteceria se existir um problema físico nos 4 hypervisors? Para esses casos, é necessário implementar o DR e para isso é fundamental possuir uma replica do ambiente em outro data center, onde em caso de falha do data center principal, é possível ativar o data center secundário.

Diferenças

Normalmente o HA é um processo automático, após a identificação da falha, os serviços começam a ser migrados. O DR é diferente, é uma escolha (emergência, botão vermelho) e nesse caso você tem duas opções: tentar restabelecer o ambiente principal ou ativar o ambiente secundário. Geralmente a opção correta é a que garantir a integridade do ambiente e levar menos tempo.

Percebam que o processo entre HA e DR são bem distintos, enquanto o HA afeta algumas máquinas virtuais e não tem parada de serviço (ou é restabelecido relativamente rápido), o DR é uma escolha, pois afeta todo o ambiente. Vamos imaginar que o HA é o governador do estado, enquanto o DR é o presidente. O governador preocupa-se apenas com as cidades do seu estado e faz o possível para que tudo funcione corretamente, já o presidente preocupa-se com todas as cidades de todos os estados. E como todos nós sabemos, o ideal é que ambos trabalhem em conjunto.

É isso aí, até a próxima!

Posts Relacionados

Ricardo é especialista em TI e apaixonado por Virtualização. É graduado em Sistemas de Informação e pós-graduado em Gestão de TI, além de possuir várias certificações Microsoft e VMware.

4 thoughts on “Alta Disponibilidade e Recuperação de Desastre

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *