manuais-e-documentacao-itguys/documentacao storage/Nivel_3/[Nível 3] Manutencao e Perf...

3.2 KiB

MANUAL TÉCNICO - MANUTENÇÃO E PERFORMANCE ZFS - TRUENAS SCALE

Código: ITGENG 0017/26 | Classificação: RESTRITO Responsável: João Pedro Toledo Gonçalves | Data: {{DATA_ATUAL}}

1. HISTÓRICO DE REVISÃO

⚠️ REGRA DE OURO:

  1. Autor: João Pedro Toledo Gonçalves.
  2. Descrição: Criação do documento.
Data Versão Descrição Autor
{{DATA_ATUAL}} 1.0 Criação Inicial João Pedro Toledo Gonçalves

2. OBJETIVO

Definir procedimentos de rotina para manutenção da integridade dos dados (Scrub), substituição de discos falhos e diagnóstico avançado de performance e eficiência ZFS.

3. PRÉ-REQUISITOS

  • Acesso Root/SSH ao servidor Truenas.
  • Conhecimento da topologia do Pool (via zpool status).

4. MANUTENÇÃO PREVENTIVA (ROTINA)

1. Data Scrubbing (Limpeza de Dados)

O Scrub lê todos os dados e verifica checksums para corrigir "Bit Rot" (corrupção silenciosa).

  • Comando Manual (Shell): zpool scrub {{NOME_POOL}}
  • Via GUI: System Settings > Scrub Tasks.
    • Frequência Recomendada: 1x por Mês (Discos Enterprise) ou 2x por Mês (Discos Consumer).
    • Monitoramento: Acompanhe o progresso com zpool status -v.

2. Testes S.M.A.R.T.

O ZFS cuida dos dados, o S.M.A.R.T cuida do disco físico.

  • Short Test: Diário.
  • Long Test: Semanal.
  • Configuração: Data Protection > S.M.A.R.T. Tests.

5. DIAGNÓSTICO DE PERFORMANCE

🚀 DICA DE OURO: Use o Shell para obter a verdade nua e crua.

A. Verificar Latência e Throughput em Tempo Real

zpool iostat -v -y 2 10
  • Mostra leitura/escrita por disco individual. Procure por discos lentos (High Latency) que travam o pool inteiro.

B. Verificar Eficiência do Cache (ARC)

arc_summary
  • Procure por "ARC Size (Current)". Se estiver em "Max", você pode precisar de mais RAM.
  • Procure por "Cache Hit Ratio".
    • 90%: Ótimo.

    • < 80%: Considere L2ARC ou Mais RAM.

C. Verificar Compressão e Deduplicação

zpool list
  • DEDUP: Se for > 1.00x, você tem deduplicação. Se for 1.00x com DEDUP ON, desligue imediatamente (está gastando RAM à toa).
  • COMPRESS: Razão de compressão do pool. 1.20x ou mais é excelente.

6. SUBSTITUIÇÃO DE DISCO (DEGRADED STATE)

Se o dashboard alertar "Pool Degraded", um disco falhou.

  1. Identifique o disco:
    • Vá em Storage > Manage Devices.
    • Procure pelo disco com status OFFLINE, UNAVAIL ou FAULTED.
    • Anote o Serial Number.
  2. Troca Física:
    • Substitua o disco fisicamente (Hot-swap, se suportado).
  3. Processo de Replace:
    • Na GUI, clique no disco falho > Replace.
    • Selecione o novo disco na lista.
    • Clique em Save.
  4. Resilvering:
    • O ZFS reconstruirá os dados. Isso pode levar horas/dias.
    • Monitore: zpool status mostra a velocidade e tempo estimado.
    • ⚠️ CRÍTICO: Durante o resilver, o pool está vulnerável. Evite carga pesada.

7. VALIDAÇÃO E CHECKLIST

  • O último Scrub rodou sem erros (0 errors)?
  • Todos os discos estão ONLINE?
  • O ARC Hit Ratio está saudável (>80%)?