manuais-e-documentacao-itguys/documentacao storage/Nivel_1/[Nível 1] Monitoramento de ...

2.7 KiB

MANUAL TÉCNICO - MONITORAMENTO DE SAÚDE DE DISCOS - TRUENAS SCALE

Código: ITGSUP 0013/26 | Classificação: RESTRITO Responsável: João Pedro Toledo Gonçalves | Data: {{DATA_ATUAL}}

1. HISTÓRICO DE REVISÃO

⚠️ REGRA DE OURO:

  1. Autor: João Pedro Toledo Gonçalves.
  2. Descrição: Criação do documento.
Data Versão Descrição Autor
{{DATA_ATUAL}} 1.0 Criação Inicial João Pedro Toledo Gonçalves

2. OBJETIVO

Orientar a equipe de Service Desk a identificar, interpretar e escalar alertas de saúde de discos no Dashboard do TrueNAS Scale.

3. PRÉ-REQUISITOS

  • Acesso à interface web do TrueNAS (https://{{IP_SERVIDOR}}).
  • Usuário com permissão de leitura (Read-Only) ou Dashboard.

4. O DASHBOARD (SINAL DE TRÂNSITO)

O TrueNAS utiliza um sistema de cores universal para indicar o status.

🟢 Verde (Healthy / Online)

  • Significado: Tudo funcionando permfeitamente.
  • Ação: Nenhuma. Apenas registre que a ronda foi feita.

🟡 Amarelo (Warning / Degraded)

  • Significado: O sistema está rodando, mas perdeu redundância. Um disco falhou ou está falhando.
  • Ação (N1):
    1. Tire um print da tela.
    2. Abra um chamado para o Nível 2 (Infraestrutura).
    3. Não reinicie o servidor.

🔴 Vermelho (Critical / Faulted / Offline)

  • Significado: Perda de dados iminente ou o serviço parou completamente.
  • Ação (N1):
    1. Escalone IMEDIATAMENTE para o Nível 3 (Engenharia) via telefone/celular.
    2. Não tente consertar sozinho.

5. ALERTAS COMUNS (E-MAIL E SINO)

No canto superior direito, há um ícone de 🔔 (Sino). Se houver um número vermelho, clique nele.

Mensagem do Alerta Tradução Ação do N1
Pool ... state is DEGRADED Um disco morreu. Escalar para N2 (Troca de Disco).
Device ... reallocated sector count Disco com badblocks. Escalar para N2 (Planejar troca).
Scrub finished with 0 errors Limpeza concluída com sucesso. Ignorar (É uma boa notícia).
Update Available Atualização de sistema. Ignorar (N3 cuida disso).

Exemplo de Alerta

6. VERIFICAÇÃO MANUAL RÁPIDA

  1. No menu lateral, clique em Storage.
  2. Olhe para a coluna Status dos Pools.
  3. Deve estar escrito ONLINE. Qualquer outra coisa (DEGRADED, OFFLINE, UNAVAIL) requer atenção.

7. VALIDAÇÃO E CHECKLIST

  • O Dashboard está sem alertas críticos?
  • Todos os Pools em Storage estão com status ONLINE?
  • (Se houver acesso físico) Há alguma luz laranja/vermelha piscando nos discos do servidor?