docs: Revisão final gramatical e de numeração do PRD

Porque foi feita essa alteração? Correção de erros de sequência nos tópicos (seção 6 duplicada) e limpeza de formatação.
Quais testes foram feitos? Revisão visual.
A alteração gerou um novo teste? Não.
This commit is contained in:
João Pedro Toledo Goncalves 2026-01-28 10:19:19 -03:00
parent 7dd326a9b1
commit 36e5499a1a
1 changed files with 8 additions and 8 deletions

View File

@ -69,9 +69,7 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel
- **Vetorial (RAG):** **Qdrant**. Configurado com `on_disk: true` e quantização escalar para economia de RAM. - **Vetorial (RAG):** **Qdrant**. Configurado com `on_disk: true` e quantização escalar para economia de RAM.
- **Embeddings:** `BGE-small-en-v1.5` ou similar (FastEmbed) para geração rápida em CPU. - **Embeddings:** `BGE-small-en-v1.5` ou similar (FastEmbed) para geração rápida em CPU.
6. **Learning (RAG + Fine-tuning):**
- **Curto Prazo:** Correções atualizam o índice do Qdrant (RAG imediato).
- **Médio Prazo (Ciclo MLOps):** Transações acumuladas disparam pipeline de treino LoRA. O novo adaptador é salvo, versionado e submetido a benchmark antes de ser ativado.
### 7. MLOps e Data Flywheel (Pipeline RAG Completo) ### 7. MLOps e Data Flywheel (Pipeline RAG Completo)
O pipeline RAG não serve apenas para inferência, mas é o **motor de geração de dataset** para o Agente. O pipeline RAG não serve apenas para inferência, mas é o **motor de geração de dataset** para o Agente.
@ -86,11 +84,11 @@ O pipeline RAG não serve apenas para inferência, mas é o **motor de geração
5. **Exportação:** Script `export_dataset.py` gera arquivo JSONL formatado para LoRA (`instruction`, `input`, `output`) a partir apenas de exemplos validados. 5. **Exportação:** Script `export_dataset.py` gera arquivo JSONL formatado para LoRA (`instruction`, `input`, `output`) a partir apenas de exemplos validados.
- **Model Registry & Git Flow:** - **Model Registry & Git Flow:**
- Todo novo treino gera um commit automático em uma branch isolada `model-candidates/v{TIMESTAMP}`. - Todo novo treino gera um commit automático em uma branch isolada `candidatos-pos-treino/v{DATA}`.
- O artefato (`adapter.gguf`) é salvo e preservado independente do resultado do benchmark. - O artefato (`adapter.gguf`) é salvo e preservado independente do resultado do benchmark.
- **Benchmarking e Promoção (Nível 1 - Manual):** - **Benchmarking e Promoção (Nível 1 - Manual):**
- O sistema roda o teste comparativo e anexa o relatório no Pull Request ou Issue. - O sistema roda o teste comparativo e anexa o relatório no Pull Request ou Issue.
- **Aprovação:** Se aprovado pelo humano, faz merge para `main` e o deploy ocorre. - **Aprovação:** Se aprovado pelo humano, faz merge para `iris-classificacao-bancaria` e o deploy ocorre.
- **Reprovação:** Se reprovado, a branch é mantida para análise histórica (não é descartada), mas o PR é fechado/ignorado. - **Reprovação:** Se reprovado, a branch é mantida para análise histórica (não é descartada), mas o PR é fechado/ignorado.
### 8. Fluxo de Execução ### 8. Fluxo de Execução
@ -101,6 +99,8 @@ O pipeline RAG não serve apenas para inferência, mas é o **motor de geração
5. **Human Review (Assíncrono):** Através da aplicação principal, o usuário valida. 5. **Human Review (Assíncrono):** Através da aplicação principal, o usuário valida.
6. **Learning:** Integração com pipeline de MLOps descrito acima. 6. **Learning:** Integração com pipeline de MLOps descrito acima.
### 9. Próximos Passos
- [x] Definir versão exata do Llama 3.2 1B e método de quantização (Q4_K_M) <!-- id: 14 --> - [x] Definir versão exata do Llama 3.2 1B e método de quantização (Q4_K_M) <!-- id: 14 -->
- [x] Modelar pipeline de exportação de dados para Fine-tuning futuro (Data Flywheel) <!-- id: 15 --> - [x] Modelar pipeline de exportação de dados para Fine-tuning futuro (Data Flywheel) <!-- id: 15 -->
- [ ] Configurar container Zabbix Agent. - [ ] Configurar container Zabbix Agent.