manuais-e-documentacao-itguys/documentacao backup/ITGSUP_0014_26_Verificacao_...

3.7 KiB

MANUAL TÉCNICO - VERIFICAÇÃO DIÁRIA DE JOBS DE VM

Código: ITGSUP 0014/26 | Classificação: INTERNO Responsável: João Pedro Toledo Gonçalves | Data: {{DATA_ATUAL}}

1. HISTÓRICO DE REVISÃO

Data Versão Descrição Autor
{{DATA_ATUAL}} 1.0 Criação Inicial João Pedro Toledo Gonçalves

2. OBJETIVO

Padronizar a rotina diária de verificação dos backups de infraestrutura virtual (Hyper-V/VMware) garantindo a detectabilidade imediata de falhas.

3. PRÉ-REQUISITOS

O que é necessário para executar:

  • Acesso ao console do Veeam Backup & Replication (Conta de Operador de Backup ou Admin).
  • Planilha ou sistema de checklist diário aberto.

4. PASSO A PASSO (EXECUÇÃO)

Etapa 1: Acesso ao Console Principal

  1. Faça login no servidor de backup (RDP ou Console Remoto).
  2. Abra o Veeam Backup & Replication Console.
  3. No menu inferior esquerdo, clique em Home.
  4. Na árvore de navegação à esquerda, selecione Jobs > Backup.

!!! note "Nota" Esta visão consolida todos os jobs configurados (VMs, Agentes Físicos, Shares).

Etapa 2: Análise do Status "Last Result"

  1. Observe a coluna Status e Last Result na lista central.
  2. Identifique os jobs com status diferente de Success.

!!! warning "LEGENDA DE CORES" * 🟢 Success: Backup completado sem erros. * 🟡 Warning: Backup completado, mas com avisos (ex: falha ao indexar guest OS, snapshot demorado). * 🔴 Failed: O backup FALHOU. VM não protegida nesta rodada.

Veeam Job List Status

Etapa 3: Investigação de Falhas (Drill-down)

  1. Dê um duplo-clique sobre o job que apresentou falha ou warning.
  2. Na janela de sessão que abrir, observe a lista de VMs à esquerda.
  3. Clique na VM que está com ícone vermelho ou amarelo.
  4. No painel da direita, leia o log de execução, buscando linhas em vermelho.

!!! tip "Dica" Erros comuns incluem "VSS Writer failed", "RPC server unavailable" ou "Snapshot creation failed".

Veeam Job Session Log

Etapa 4: Registro de Incidente

  1. Se houver falha (🔴), abra imediatamente um ticket no Zammad para a equipe de Nível 2 (Infra).
  2. No corpo do ticket, cole o erro exato encontrado no log (passo anterior).
  3. Se for apenas Warning (🟡), registre na observação do checklist, mas não requer ticket urgente se houver pontos de restauração anteriores válidos recentes.

5. SOLUÇÃO DE PROBLEMAS (TROUBLESHOOTING)

Problema 1: Job parado em "Running" há mais de 24h

  • Causa: Processo travado ou snapshot preso no hipervisor.
  • Solução:
    1. Tente parar o job com Right-Click > Stop.
    2. Se não parar, verifique no vCenter/Hyper-V se há snapshots pendentes na VM e remova-os (Consolidate).
    3. Reinicie os serviços do Veeam se necessário (escalonar para Nível 2).

Problema 2: Erro "RPC Server Unavailable"

  • Causa: Falha de comunicação de rede ou firewall entre Veeam e VM Guest.
  • Solução:
    1. Teste ping do servidor Veeam para a VM.
    2. Verifique se o serviço "Admin Share" (C$) está acessível.

6. DADOS TÉCNICOS

Campo Valor Descrição
Portas 9392, 10001 Portas de Console e Serviço Veeam
Logs C:\ProgramData\Veeam\Backup Caminho de logs detalhados
SLA 24 Horas RPO Padrão (janela diária)

7. VALIDAÇÃO FINAL (Definição de Pronto)

O procedimento termina quando:

  • Todos os jobs foram verificados visualmente.
  • Falhas críticas (Failed) foram escalonadas via Ticket.
  • Checklist diário foi preenchido com "Ok" ou "Incidente nº XXX".