89 lines
3.2 KiB
Markdown
89 lines
3.2 KiB
Markdown
# MANUAL TÉCNICO - MANUTENÇÃO E PERFORMANCE ZFS - TRUENAS SCALE
|
|
|
|
**Código:** ITGENG 0017/26 | **Classificação:** RESTRITO
|
|
**Responsável:** João Pedro Toledo Gonçalves | **Data:** {{DATA_ATUAL}}
|
|
|
|
## 1. HISTÓRICO DE REVISÃO
|
|
|
|
> ⚠️ **REGRA DE OURO:**
|
|
> 1. **Autor:** João Pedro Toledo Gonçalves.
|
|
> 2. **Descrição:** Criação do documento.
|
|
|
|
| Data | Versão | Descrição | Autor |
|
|
| :--- | :--- | :--- | :--- |
|
|
| {{DATA_ATUAL}} | 1.0 | Criação Inicial | João Pedro Toledo Gonçalves |
|
|
|
|
## 2. OBJETIVO
|
|
Definir procedimentos de rotina para manutenção da integridade dos dados (Scrub), substituição de discos falhos e diagnóstico avançado de performance e eficiência ZFS.
|
|
|
|
## 3. PRÉ-REQUISITOS
|
|
- [ ] Acesso Root/SSH ao servidor Truenas.
|
|
- [ ] Conhecimento da topologia do Pool (via `zpool status`).
|
|
|
|
## 4. MANUTENÇÃO PREVENTIVA (ROTINA)
|
|
|
|
### 1. Data Scrubbing (Limpeza de Dados)
|
|
O Scrub lê **todos os dados** e verifica checksums para corrigir "Bit Rot" (corrupção silenciosa).
|
|
|
|
* **Comando Manual (Shell):** `zpool scrub {{NOME_POOL}}`
|
|
* **Via GUI:** `System Settings` > `Scrub Tasks`.
|
|
* **Frequência Recomendada:** 1x por Mês (Discos Enterprise) ou 2x por Mês (Discos Consumer).
|
|
* **Monitoramento:** Acompanhe o progresso com `zpool status -v`.
|
|
|
|
### 2. Testes S.M.A.R.T.
|
|
O ZFS cuida dos dados, o S.M.A.R.T cuida do disco físico.
|
|
|
|
* **Short Test:** Diário.
|
|
* **Long Test:** Semanal.
|
|
* **Configuração:** `Data Protection` > `S.M.A.R.T. Tests`.
|
|
|
|
## 5. DIAGNÓSTICO DE PERFORMANCE
|
|
|
|
> 🚀 **DICA DE OURO:** Use o Shell para obter a verdade nua e crua.
|
|
|
|
### A. Verificar Latência e Throughput em Tempo Real
|
|
```bash
|
|
zpool iostat -v -y 2 10
|
|
```
|
|
* Mostra leitura/escrita por disco individual. Procure por discos lentos (High Latency) que travam o pool inteiro.
|
|
|
|
### B. Verificar Eficiência do Cache (ARC)
|
|
```bash
|
|
arc_summary
|
|
```
|
|
* Procure por **"ARC Size (Current)"**. Se estiver em "Max", você pode precisar de mais RAM.
|
|
* Procure por **"Cache Hit Ratio"**.
|
|
* > 90%: Ótimo.
|
|
* < 80%: Considere L2ARC ou Mais RAM.
|
|
|
|
### C. Verificar Compressão e Deduplicação
|
|
```bash
|
|
zpool list
|
|
```
|
|
* **DEDUP:** Se for > 1.00x, você tem deduplicação. Se for 1.00x com DEDUP ON, **desligue imediatamente** (está gastando RAM à toa).
|
|
* **COMPRESS:** Razão de compressão do pool. 1.20x ou mais é excelente.
|
|
|
|
## 6. SUBSTITUIÇÃO DE DISCO (DEGRADED STATE)
|
|
|
|
Se o dashboard alertar "Pool Degraded", um disco falhou.
|
|
|
|
1. **Identifique o disco:**
|
|
* Vá em `Storage` > `Manage Devices`.
|
|
* Procure pelo disco com status `OFFLINE`, `UNAVAIL` ou `FAULTED`.
|
|
* Anote o Serial Number.
|
|
2. **Troca Física:**
|
|
* Substitua o disco fisicamente (Hot-swap, se suportado).
|
|
3. **Processo de Replace:**
|
|
* Na GUI, clique no disco falho > **Replace**.
|
|
* Selecione o novo disco na lista.
|
|
* Clique em **Save**.
|
|
4. **Resilvering:**
|
|
* O ZFS reconstruirá os dados. Isso pode levar horas/dias.
|
|
* **Monitore:** `zpool status` mostra a velocidade e tempo estimado.
|
|
* > ⚠️ **CRÍTICO:** Durante o resilver, o pool está vulnerável. Evite carga pesada.
|
|
|
|
## 7. VALIDAÇÃO E CHECKLIST
|
|
- [ ] O último Scrub rodou sem erros (0 errors)?
|
|
- [ ] Todos os discos estão `ONLINE`?
|
|
- [ ] O ARC Hit Ratio está saudável (>80%)?
|