manuais-e-documentacao-itguys/documentacao vmware/N3_04_DR_Arquitetura.md

# Disaster Recovery e Arquitetura

## 1. Cluster DRS (Distributed Resource Scheduler)

O DRS balanceia carga.

### Affinity Rules (Regras de Afinidade)

- **VM-VM Affinity:** "Mantenha estas VMs juntas" (ex: App e DB para latência baixa).
- **VM-VM Anti-Affinity:** "Separe estas VMs" (ex: AD Primário e AD Secundário). **CRÍTICO para disponibilidade.**
- **VM-Host Affinity:**
  - _Required (Must):_ "VM deve rodar neste grupo de hosts". Se os hosts caírem, a VM **NÃO** liga em outro lugar. Cuidado! Use para licenciamento (ex: Oracle).
  - _Preferential (Should):_ "VM deve tentar rodar aqui". Se cair, ela migra. Mais seguro.

## 2. Planejamento de Capacidade (Sizing)

O N3 deve prever o esgotamento de recursos.

- **Commitment:** Quanto de vCPU/vRAM foi vendido (criado).
- **Usage:** Quanto está sendo realmente usado.
- **Headroom:** Quantas VMs eu ainda consigo ligar?
- _Regra de Ouro:_ Projete o cluster para suportar a falha de 1 Host (N+1). Se você tem 3 hosts e 1 falha, os 2 restantes devem aguentar 100% da carga. Se o uso de RAM passar de 66% (num cluster de 3), você não tem redundância real.

## 3. Restore de vCenter (VCSA)

Se o vCenter morrer, o cluster continua rodando (HA e vSwitch funcionam), mas você perde gerenciamento (vMotion, criar VMs).

### Restore via VAMI

1. Monte a ISO do instalador do VCSA numa máquina de admin.
2. Rode o instalador > Opção **Restore**.
3. Aponte para o backup de arquivo (File-based Backup) que deve ter sido configurado previamente no VAMI (`https://vcsa-ip:5480`).
4. O processo sobe um novo appliance e injeta a configuração.

## 4. Host Down Scenarios (Cenários de Falha)

- **Host Isolado (Isolation):** O Host perde rede mas continua ligado.

  - Configuração de HA "Response for Host Isolation":
    - _Power Off and Restart VMs:_ O host desliga as VMs, liberando o lock do disco, para que outros hosts as reiniciem. (Recomendado para iSCSI/NFS).
    - _Disabled:_ As VMs continuam rodando no host isolado. Se o storage também caiu para ele, as VMs travam.

- **PSOD (Purple Screen of Death):** Tela roxa no ESXi.
  - Tire foto/screenshot da tela (ou pegue o Core Dump se configurado).
  - Anota as mensagens de erro (ex: `LINT1/NMI`, `PF Exception`).
  - Geralmente é falha de Hardware (RAM/CPU) ou Driver com bug.