Migração de Azure para AWS com Resiliência Multi-AZ e 100% de Uptime na VPN
Descrição Curta do Estudo de Caso
Esta solução AWS substitui um ambiente legado no Azure por uma arquitetura Multi-AZ em São Paulo. Conta com quatro túneis VPN redundantes garantindo 100% de disponibilidade e utilizou o AWS MGN para reduzir o downtime de migração para 18 minutos, assegurando alta disponibilidade para SQL Server e ColdFusion.
Problema / Definição
A infraestrutura legada, anteriormente hospedada no Microsoft Azure, apresentava quedas frequentes e intermitentes de conectividade entre as filiais do Rio de Janeiro e o ambiente em nuvem, resultando em 3 a 4 horas de indisponibilidade mensal e exigindo intervenção manual constante.
Além disso, o processo de migração existente para as 11 máquinas virtuais críticas — incluindo aplicações de SQL Server e ColdFusion — representava alto risco de interrupção prolongada dos serviços, com estimativas tradicionais de cutover variando entre 4 e 8 horas por servidor.
Para garantir a continuidade do negócio e suportar períodos de alta demanda, o projeto exigia a transição para uma arquitetura resiliente em AWS, Multi-AZ, capaz de oferecer 100% de uptime na conectividade híbrida e uma janela de migração significativamente reduzida.
Solução Proposta e Arquitetura
A carga de trabalho foi distribuída em duas Zonas de Disponibilidade (AZ-A e AZ-B) dentro de uma VPC de Produção (10.120.0.0/16), eliminando pontos únicos de falha.
- Camada de Aplicação (App Tier):
Utiliza um Auto Scaling Group (ASG) com servidores ColdFusion e Linux Web, gerenciado por um Application Load Balancer (ALB) para distribuição elástica de tráfego. - Camada de Banco de Dados (Database Tier):
Utiliza SQL Server com Always On Availability Groups em sub-redes privadas, garantindo replicação síncrona e failover automático. - Conectividade:
Implementada via AWS Site-to-Site VPN com 4 túneis redundantes integrados a firewalls Fortigate on-premises, garantindo 100% de uptime para sincronização do Active Directory e acesso das filiais. - Serviços Gerenciados:
- ECS Fargate para serviço SFTP serverless
- Stack de monitoramento com Zabbix e Grafana para telemetria em tempo real
- Migração:
As 11 máquinas virtuais foram migradas utilizando AWS Application Migration Service (MGN), com replicação contínua em nível de bloco, minimizando perda de dados.
Essa estratégia possibilitou um processo de cutover altamente eficiente, reduzindo o downtime médio para 18 minutos por servidor.
Resultados do Projeto e Métricas de Sucesso
O projeto implementou com sucesso quatro túneis VPN redundantes e uma configuração DNS com IP fixo, eliminando completamente as 3–4 horas de downtime mensal anteriores.
Com o uso do AWS MGN e replicação contínua em nível de bloco:
- O tempo de cutover foi reduzido de 4–8 horas para uma média de 18 minutos por servidor
A migração das 11 máquinas virtuais para uma arquitetura Multi-AZ garantiu:
- Alta disponibilidade para aplicações críticas de SQL Server e ColdFusion
- Failover automático (inexistente anteriormente)
A integração com Zabbix e Grafana estabeleceu:
- Monitoramento em tempo real
- Detecção proativa de problemas de infraestrutura e performance
O uso de:
- Application Load Balancers
- Auto Scaling Groups
permitiu adaptação automática à demanda, garantindo performance em períodos de alto tráfego.
Lições Aprendidas
- A utilização do modo “Test Mode” do AWS MGN foi essencial para identificar previamente um erro de mapeamento de datasource do ColdFusion, evitando atrasos em produção.
- A migração de um modelo com ponto único de falha para uma arquitetura com VPN redundante de quatro túneis mostrou-se fundamental para workloads legados que dependem de sincronização contínua com o Active Directory on-premises.
- A adoção de Infrastructure as Code (IaC) garantiu consistência total do ambiente em múltiplas zonas de disponibilidade, permitindo uma migração confiável, repetível e alinhada com a meta de 18 minutos de cutover.
