37 lines
1.9 KiB
Markdown
37 lines
1.9 KiB
Markdown
# Storage Deep Dive
|
|
|
|
## 1. Pluggable Storage Architecture (PSA)
|
|
|
|
O ESXi usa o PSA para gerenciar multipathing.
|
|
|
|
- **NMP (Native Multipathing Plugin):** Padrão.
|
|
- **Path Selection Policies (PSP):**
|
|
- **Fixed:** Usa um caminho preferido. Se cair, troca. Se voltar, volta pro preferido.
|
|
- **MRU (Most Recently Used):** Não volta automaticamente para o preferido. Padrão para muitos storages A/P.
|
|
- **RR (Round Robin):** Alterna I/O entre caminhos ativos. Melhor performance agregada.
|
|
- _Dica N3:_ Verifique se o storage array recomenda alterar o IOPS limit do Round Robin (padrão 1000) para 1 (para melhor balanceamento). Comando: `esxcli storage nmp psp roundrobin deviceconfig set ...`
|
|
|
|
## 2. vSAN (Virtual SAN)
|
|
|
|
Storage definido por software usando discos locais dos hosts.
|
|
|
|
### Troubleshooting Básico vSAN
|
|
|
|
- **Skyline Health:** Monitor > vSAN > Skyline Health. É o painel de controle principal. Resolva TUDO que estiver vermelho aqui.
|
|
- **Object Health:** Se houver "Inaccessible objects", dados estão indisponíveis (falha de >1 host/disco além da tolerância FTT).
|
|
- **Resyncing Objects:** Após falha ou manutenção, o vSAN reconstrói dados. Isso consome I/O. Você pode limitar a banda de resync se as VMs estiverem lentas.
|
|
|
|
## 3. Storage I/O Control (SIOC)
|
|
|
|
Recurso para garantir QoS no disco.
|
|
|
|
- Se habilitado, o ESXi monitora a latência do datastore.
|
|
- Serve para evitar que uma "VM barulhenta" (Noisy Neighbor) drene todo o I/O do storage.
|
|
- _Debug:_ Se VMs estão lentas sem motivo aparente, verifique se o SIOC não está limitando artificialmente (Threshold muito baixo).
|
|
|
|
## 4. VMFS Locking e Metadata
|
|
|
|
- **VMFS-6:** Suporta recuperação automática de espaço (UNMAP) assíncrona.
|
|
- **File Locks:** Se uma VM não liga dizendo "File locked", um host ainda está segurando o arquivo.
|
|
- _Solução:_ Identificar qual host tem o lock (via logs `vmkernel.log` buscando o endereço MAC do locker) e reiniciar o processo de gerenciamento nele.
|