manuais-e-documentacao-itguys/documentacao vmware/[Nível 1] Monitoramento Bás...

44 lines
2.4 KiB
Markdown

# Monitoramento Básico de Alertas e Recursos
## 1. Identificando Alertas
O vSphere usa um sistema de semáforo nos ícones das VMs e Hosts.
- **Verde (Normal):** Tudo OK.
- **Amarelo (Warning):** Atenção necessária (ex: Uso de disco alto, Snapshot antigo, VMware Tools desatualizado).
- **Vermelho (Critical):** Problema grave (ex: Host desconectado, Datastore cheio, VM sem rede).
### Onde ver o erro?
1. Clique na VM ou Host com alerta.
2. Na aba **Summary**, procure pelo quadro **Triggered Alarms**.
3. Leia a descrição. Ex: "Virtual machine memory usage is at 100%".
## 2. Monitorando Performance (Básico)
Se um usuário reclama de lentidão:
1. Vá na aba **Monitor** > **Overview** (ou Performance > Overview).
2. Observe os gráficos de **CPU** e **Memory**.
- **Uso Constante de 100%:** A VM está subdimensionada ou um processo travou.
- _Ação:_ Verifique processos dentro do SO (Task Manager) ou escalone para N2 avaliar aumento de recursos.
- **Uso Baixo:** O problema de lentidão não é falta de recurso da VM. Pode ser Rede, Storage ou Aplicação.
## 3. Alertas Comuns para Nível 1
| Alerta | Significado | Ação N1 |
| :--------------------------------------- | :-------------------------------------- | :------------------------------------------------------------------------------ |
| **Virtual machine consolidation needed** | Snapshots inconsistentes. | Escalonar para N2 (Risco de travar backup). |
| **Virtual machine memory usage** | RAM alocada esgotada. | Verificar processos no SO. |
| **Datastore usage on disk** | Disco físico onde a VM mora está cheio. | **CRÍTICO**. Escalonar IMEDIATAMENTE para N2/N3. Não crie Snapshots. |
| **VMware Tools outdated** | Versão antiga dos drivers. | Planejar atualização (geralmente automático no reboot, mas verifique política). |
## 4. Como Escalonar
Ao passar um chamado para o Nível 2, informe OBRIGATORIAMENTE:
1. **Nome da VM** e **IP**.
2. **Nome do Host** (onde ela está rodando).
3. **Erro exato** ou print do Alarme.
4. **O que já foi feito** (ex: "Tentei Restart Guest OS mas falhou", "Verifiquei que a CPU está em 10%").