1.9 KiB
1.9 KiB
Storage Deep Dive
1. Pluggable Storage Architecture (PSA)
O ESXi usa o PSA para gerenciar multipathing.
- NMP (Native Multipathing Plugin): Padrão.
- Path Selection Policies (PSP):
- Fixed: Usa um caminho preferido. Se cair, troca. Se voltar, volta pro preferido.
- MRU (Most Recently Used): Não volta automaticamente para o preferido. Padrão para muitos storages A/P.
- RR (Round Robin): Alterna I/O entre caminhos ativos. Melhor performance agregada.
- Dica N3: Verifique se o storage array recomenda alterar o IOPS limit do Round Robin (padrão 1000) para 1 (para melhor balanceamento). Comando:
esxcli storage nmp psp roundrobin deviceconfig set ...
2. vSAN (Virtual SAN)
Storage definido por software usando discos locais dos hosts.
Troubleshooting Básico vSAN
- Skyline Health: Monitor > vSAN > Skyline Health. É o painel de controle principal. Resolva TUDO que estiver vermelho aqui.
- Object Health: Se houver "Inaccessible objects", dados estão indisponíveis (falha de >1 host/disco além da tolerância FTT).
- Resyncing Objects: Após falha ou manutenção, o vSAN reconstrói dados. Isso consome I/O. Você pode limitar a banda de resync se as VMs estiverem lentas.
3. Storage I/O Control (SIOC)
Recurso para garantir QoS no disco.
- Se habilitado, o ESXi monitora a latência do datastore.
- Serve para evitar que uma "VM barulhenta" (Noisy Neighbor) drene todo o I/O do storage.
- Debug: Se VMs estão lentas sem motivo aparente, verifique se o SIOC não está limitando artificialmente (Threshold muito baixo).
4. VMFS Locking e Metadata
- VMFS-6: Suporta recuperação automática de espaço (UNMAP) assíncrona.
- File Locks: Se uma VM não liga dizendo "File locked", um host ainda está segurando o arquivo.
- Solução: Identificar qual host tem o lock (via logs
vmkernel.logbuscando o endereço MAC do locker) e reiniciar o processo de gerenciamento nele.
- Solução: Identificar qual host tem o lock (via logs