manuais-e-documentacao-itguys/documentacao vmware/N3_04_DR_Arquitetura.md

47 lines
2.3 KiB
Markdown

# Disaster Recovery e Arquitetura
## 1. Cluster DRS (Distributed Resource Scheduler)
O DRS balanceia carga.
### Affinity Rules (Regras de Afinidade)
- **VM-VM Affinity:** "Mantenha estas VMs juntas" (ex: App e DB para latência baixa).
- **VM-VM Anti-Affinity:** "Separe estas VMs" (ex: AD Primário e AD Secundário). **CRÍTICO para disponibilidade.**
- **VM-Host Affinity:**
- _Required (Must):_ "VM deve rodar neste grupo de hosts". Se os hosts caírem, a VM **NÃO** liga em outro lugar. Cuidado! Use para licenciamento (ex: Oracle).
- _Preferential (Should):_ "VM deve tentar rodar aqui". Se cair, ela migra. Mais seguro.
## 2. Planejamento de Capacidade (Sizing)
O N3 deve prever o esgotamento de recursos.
- **Commitment:** Quanto de vCPU/vRAM foi vendido (criado).
- **Usage:** Quanto está sendo realmente usado.
- **Headroom:** Quantas VMs eu ainda consigo ligar?
- _Regra de Ouro:_ Projete o cluster para suportar a falha de 1 Host (N+1). Se você tem 3 hosts e 1 falha, os 2 restantes devem aguentar 100% da carga. Se o uso de RAM passar de 66% (num cluster de 3), você não tem redundância real.
## 3. Restore de vCenter (VCSA)
Se o vCenter morrer, o cluster continua rodando (HA e vSwitch funcionam), mas você perde gerenciamento (vMotion, criar VMs).
### Restore via VAMI
1. Monte a ISO do instalador do VCSA numa máquina de admin.
2. Rode o instalador > Opção **Restore**.
3. Aponte para o backup de arquivo (File-based Backup) que deve ter sido configurado previamente no VAMI (`https://vcsa-ip:5480`).
4. O processo sobe um novo appliance e injeta a configuração.
## 4. Host Down Scenarios (Cenários de Falha)
- **Host Isolado (Isolation):** O Host perde rede mas continua ligado.
- Configuração de HA "Response for Host Isolation":
- _Power Off and Restart VMs:_ O host desliga as VMs, liberando o lock do disco, para que outros hosts as reiniciem. (Recomendado para iSCSI/NFS).
- _Disabled:_ As VMs continuam rodando no host isolado. Se o storage também caiu para ele, as VMs travam.
- **PSOD (Purple Screen of Death):** Tela roxa no ESXi.
- Tire foto/screenshot da tela (ou pegue o Core Dump se configurado).
- Anota as mensagens de erro (ex: `LINT1/NMI`, `PF Exception`).
- Geralmente é falha de Hardware (RAM/CPU) ou Driver com bug.