manuais-e-documentacao-itguys/documentacao storage/Nivel_1_[Nível 1] Monitoram...

67 lines
2.7 KiB
Markdown

# MANUAL TÉCNICO - MONITORAMENTO DE SAÚDE DE DISCOS - TRUENAS SCALE
**Código:** ITGSUP 0013/26 | **Classificação:** RESTRITO
**Responsável:** João Pedro Toledo Gonçalves | **Data:** {{DATA_ATUAL}}
## 1. HISTÓRICO DE REVISÃO
> ⚠️ **REGRA DE OURO:**
> 1. **Autor:** João Pedro Toledo Gonçalves.
> 2. **Descrição:** Criação do documento.
| Data | Versão | Descrição | Autor |
| :--- | :--- | :--- | :--- |
| {{DATA_ATUAL}} | 1.0 | Criação Inicial | João Pedro Toledo Gonçalves |
## 2. OBJETIVO
Orientar a equipe de Service Desk a identificar, interpretar e escalar alertas de saúde de discos no Dashboard do TrueNAS Scale.
## 3. PRÉ-REQUISITOS
- [ ] Acesso à interface web do TrueNAS (`https://{{IP_SERVIDOR}}`).
- [ ] Usuário com permissão de leitura (Read-Only) ou Dashboard.
## 4. O DASHBOARD (SINAL DE TRÂNSITO)
O TrueNAS utiliza um sistema de cores universal para indicar o status.
### 🟢 Verde (Healthy / Online)
* **Significado:** Tudo funcionando permfeitamente.
* **Ação:** Nenhuma. Apenas registre que a ronda foi feita.
### 🟡 Amarelo (Warning / Degraded)
* **Significado:** O sistema está rodando, mas perdeu redundância. Um disco falhou ou está falhando.
* **Ação (N1):**
1. Tire um print da tela.
2. Abra um chamado para o Nível 2 (Infraestrutura).
3. **Não reinicie o servidor.**
### 🔴 Vermelho (Critical / Faulted / Offline)
* **Significado:** Perda de dados iminente ou o serviço parou completamente.
* **Ação (N1):**
1. **Escalone IMEDIATAMENTE** para o Nível 3 (Engenharia) via telefone/celular.
2. Não tente consertar sozinho.
## 5. ALERTAS COMUNS (E-MAIL E SINO)
No canto superior direito, há um ícone de 🔔 (Sino). Se houver um número vermelho, clique nele.
| Mensagem do Alerta | Tradução | Ação do N1 |
| :--- | :--- | :--- |
| `Pool ... state is DEGRADED` | Um disco morreu. | Escalar para N2 (Troca de Disco). |
| `Device ... reallocated sector count` | Disco com badblocks. | Escalar para N2 (Planejar troca). |
| `Scrub finished with 0 errors` | Limpeza concluída com sucesso. | Ignorar (É uma boa notícia). |
| `Update Available` | Atualização de sistema. | Ignorar (N3 cuida disso). |
![Exemplo de Alerta](assets/dashboard_alert.png)
## 6. VERIFICAÇÃO MANUAL RÁPIDA
1. No menu lateral, clique em **Storage**.
2. Olhe para a coluna **Status** dos Pools.
3. Deve estar escrito `ONLINE`. Qualquer outra coisa (`DEGRADED`, `OFFLINE`, `UNAVAIL`) requer atenção.
## 7. VALIDAÇÃO E CHECKLIST
- [ ] O Dashboard está sem alertas críticos?
- [ ] Todos os Pools em `Storage` estão com status `ONLINE`?
- [ ] (Se houver acesso físico) Há alguma luz laranja/vermelha piscando nos discos do servidor?