manuais-e-documentacao-itguys/documentacao storage/[Nível 3] Manutencao e Perf...

89 lines
3.2 KiB
Markdown

# MANUAL TÉCNICO - MANUTENÇÃO E PERFORMANCE ZFS - TRUENAS SCALE
**Código:** ITGENG 0017/26 | **Classificação:** RESTRITO
**Responsável:** João Pedro Toledo Gonçalves | **Data:** {{DATA_ATUAL}}
## 1. HISTÓRICO DE REVISÃO
> ⚠️ **REGRA DE OURO:**
> 1. **Autor:** João Pedro Toledo Gonçalves.
> 2. **Descrição:** Criação do documento.
| Data | Versão | Descrição | Autor |
| :--- | :--- | :--- | :--- |
| {{DATA_ATUAL}} | 1.0 | Criação Inicial | João Pedro Toledo Gonçalves |
## 2. OBJETIVO
Definir procedimentos de rotina para manutenção da integridade dos dados (Scrub), substituição de discos falhos e diagnóstico avançado de performance e eficiência ZFS.
## 3. PRÉ-REQUISITOS
- [ ] Acesso Root/SSH ao servidor Truenas.
- [ ] Conhecimento da topologia do Pool (via `zpool status`).
## 4. MANUTENÇÃO PREVENTIVA (ROTINA)
### 1. Data Scrubbing (Limpeza de Dados)
O Scrub lê **todos os dados** e verifica checksums para corrigir "Bit Rot" (corrupção silenciosa).
* **Comando Manual (Shell):** `zpool scrub {{NOME_POOL}}`
* **Via GUI:** `System Settings` > `Scrub Tasks`.
* **Frequência Recomendada:** 1x por Mês (Discos Enterprise) ou 2x por Mês (Discos Consumer).
* **Monitoramento:** Acompanhe o progresso com `zpool status -v`.
### 2. Testes S.M.A.R.T.
O ZFS cuida dos dados, o S.M.A.R.T cuida do disco físico.
* **Short Test:** Diário.
* **Long Test:** Semanal.
* **Configuração:** `Data Protection` > `S.M.A.R.T. Tests`.
## 5. DIAGNÓSTICO DE PERFORMANCE
> 🚀 **DICA DE OURO:** Use o Shell para obter a verdade nua e crua.
### A. Verificar Latência e Throughput em Tempo Real
```bash
zpool iostat -v -y 2 10
```
* Mostra leitura/escrita por disco individual. Procure por discos lentos (High Latency) que travam o pool inteiro.
### B. Verificar Eficiência do Cache (ARC)
```bash
arc_summary
```
* Procure por **"ARC Size (Current)"**. Se estiver em "Max", você pode precisar de mais RAM.
* Procure por **"Cache Hit Ratio"**.
* > 90%: Ótimo.
* < 80%: Considere L2ARC ou Mais RAM.
### C. Verificar Compressão e Deduplicação
```bash
zpool list
```
* **DEDUP:** Se for > 1.00x, você tem deduplicação. Se for 1.00x com DEDUP ON, **desligue imediatamente** (está gastando RAM à toa).
* **COMPRESS:** Razão de compressão do pool. 1.20x ou mais é excelente.
## 6. SUBSTITUIÇÃO DE DISCO (DEGRADED STATE)
Se o dashboard alertar "Pool Degraded", um disco falhou.
1. **Identifique o disco:**
* Vá em `Storage` > `Manage Devices`.
* Procure pelo disco com status `OFFLINE`, `UNAVAIL` ou `FAULTED`.
* Anote o Serial Number.
2. **Troca Física:**
* Substitua o disco fisicamente (Hot-swap, se suportado).
3. **Processo de Replace:**
* Na GUI, clique no disco falho > **Replace**.
* Selecione o novo disco na lista.
* Clique em **Save**.
4. **Resilvering:**
* O ZFS reconstruirá os dados. Isso pode levar horas/dias.
* **Monitore:** `zpool status` mostra a velocidade e tempo estimado.
* > ⚠️ **CRÍTICO:** Durante o resilver, o pool está vulnerável. Evite carga pesada.
## 7. VALIDAÇÃO E CHECKLIST
- [ ] O último Scrub rodou sem erros (0 errors)?
- [ ] Todos os discos estão `ONLINE`?
- [ ] O ARC Hit Ratio está saudável (>80%)?