manuais-e-documentacao-itguys/documentacao backup/[Nível 1] Verificação Diári...

86 lines
3.7 KiB
Markdown

# MANUAL TÉCNICO - VERIFICAÇÃO DIÁRIA DE JOBS DE VM
**Código:** ITGSUP 0014/26 | **Classificação:** INTERNO
**Responsável:** João Pedro Toledo Gonçalves | **Data:** {{DATA_ATUAL}}
## 1. HISTÓRICO DE REVISÃO
| Data | Versão | Descrição | Autor |
| :--- | :--- | :--- | :--- |
| {{DATA_ATUAL}} | 1.0 | Criação Inicial | João Pedro Toledo Gonçalves |
## 2. OBJETIVO
Padronizar a rotina diária de verificação dos backups de infraestrutura virtual (Hyper-V/VMware) garantindo a detectabilidade imediata de falhas.
## 3. PRÉ-REQUISITOS
> O que é necessário para executar:
* [ ] Acesso ao console do **Veeam Backup & Replication** (Conta de Operador de Backup ou Admin).
* [ ] Planilha ou sistema de checklist diário aberto.
## 4. PASSO A PASSO (EXECUÇÃO)
**Etapa 1: Acesso ao Console Principal**
1. Faça login no servidor de backup (RDP ou Console Remoto).
2. Abra o **Veeam Backup & Replication Console**.
3. No menu inferior esquerdo, clique em **Home**.
4. Na árvore de navegação à esquerda, selecione **Jobs** > **Backup**.
!!! note "Nota"
Esta visão consolida todos os jobs configurados (VMs, Agentes Físicos, Shares).
**Etapa 2: Análise do Status "Last Result"**
1. Observe a coluna **Status** e **Last Result** na lista central.
2. Identifique os jobs com status diferente de **Success**.
!!! warning "LEGENDA DE CORES"
* 🟢 **Success:** Backup completado sem erros.
* 🟡 **Warning:** Backup completado, mas com avisos (ex: falha ao indexar guest OS, snapshot demorado).
* 🔴 **Failed:** O backup FALHOU. VM não protegida nesta rodada.
![Veeam Job List Status](assets/veeam_jobs_list.png)
**Etapa 3: Investigação de Falhas (Drill-down)**
1. Dê um **duplo-clique** sobre o job que apresentou falha ou warning.
2. Na janela de sessão que abrir, observe a lista de VMs à esquerda.
3. Clique na VM que está com ícone vermelho ou amarelo.
4. No painel da direita, leia o log de execução, buscando linhas em **vermelho**.
!!! tip "Dica"
Erros comuns incluem "VSS Writer failed", "RPC server unavailable" ou "Snapshot creation failed".
![Veeam Job Session Log](assets/veeam_job_log.png)
**Etapa 4: Registro de Incidente**
1. Se houver falha (🔴), abra imediatamente um ticket no Zammad para a equipe de Nível 2 (Infra).
2. No corpo do ticket, cole o erro exato encontrado no log (passo anterior).
3. Se for apenas Warning (🟡), registre na observação do checklist, mas não requer ticket urgente se houver pontos de restauração anteriores válidos recentes.
## 5. SOLUÇÃO DE PROBLEMAS (TROUBLESHOOTING)
**Problema 1: Job parado em "Running" há mais de 24h**
* **Causa:** Processo travado ou snapshot preso no hipervisor.
* **Solução:**
1. Tente parar o job com **Right-Click > Stop**.
2. Se não parar, verifique no vCenter/Hyper-V se há snapshots pendentes na VM e remova-os (Consolidate).
3. Reinicie os serviços do Veeam se necessário (escalonar para Nível 2).
**Problema 2: Erro "RPC Server Unavailable"**
* **Causa:** Falha de comunicação de rede ou firewall entre Veeam e VM Guest.
* **Solução:**
1. Teste ping do servidor Veeam para a VM.
2. Verifique se o serviço "Admin Share" (C$) está acessível.
## 6. DADOS TÉCNICOS
| Campo | Valor | Descrição |
| :--- | :--- | :--- |
| **Portas** | 9392, 10001 | Portas de Console e Serviço Veeam |
| **Logs** | `C:\ProgramData\Veeam\Backup` | Caminho de logs detalhados |
| **SLA** | 24 Horas | RPO Padrão (janela diária) |
## 7. VALIDAÇÃO FINAL (Definição de Pronto)
> O procedimento termina quando:
- [ ] Todos os jobs foram verificados visualmente.
- [ ] Falhas críticas (Failed) foram escalonadas via Ticket.
- [ ] Checklist diário foi preenchido com "Ok" ou "Incidente nº XXX".