diff --git a/.gemini/PRD_Classificacao_Bancaria.md b/.gemini/PRD_Classificacao_Bancaria.md index 410643a..135a36c 100644 --- a/.gemini/PRD_Classificacao_Bancaria.md +++ b/.gemini/PRD_Classificacao_Bancaria.md @@ -73,8 +73,18 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel - **Curto Prazo:** Correções atualizam o índice do Qdrant (RAG imediato). - **Médio Prazo (Ciclo MLOps):** Transações acumuladas disparam pipeline de treino LoRA. O novo adaptador é salvo, versionado e submetido a benchmark antes de ser ativado. -### 7. MLOps e Versionamento (Critical) -O sistema deve garantir a reprodutibilidade e métrica de evolução dos modelos. +### 7. MLOps e Data Flywheel (Pipeline RAG Completo) +O pipeline RAG não serve apenas para inferência, mas é o **motor de geração de dataset** para o Agente. +- **Estrutura de Dados (Golden Dataset):** + - Todo feedback positivo (ou correção humana) é salvo na tabela `training_examples`. + - **Campos:** `input_text` (Descrição + Metadados), `output_json` (Categoria Correta), `source` (Human/Auto), `timestamp`. +- **Ciclo de Vida do Dado:** + 1. **Ingestão:** Transação chega via API. + 2. **Busca & Inferência:** Agente sugere classificação. + 3. **Feedback:** Aplicação confirma ou corrige a classificação. + 4. **Persistência:** O par `{Input, Correct_Output}` é salvo no PostgreSQL e indexado no Qdrant. + 5. **Exportação:** Script `export_dataset.py` gera arquivo JSONL formatado para LoRA (`instruction`, `input`, `output`) a partir apenas de exemplos validados. + - **Model Registry Local:** - Estrutura de pastas padronizada: `models/v{VERSION_ID}/`. - Cada versão deve conter: `adapter.gguf`, `training_metrics.json` e `benchmark_report.json`. @@ -91,5 +101,5 @@ O sistema deve garantir a reprodutibilidade e métrica de evolução dos modelos 6. **Learning:** Integração com pipeline de MLOps descrito acima. - [x] Definir versão exata do Llama 3.2 1B e método de quantização (Q4_K_M) + - [x] Modelar pipeline de exportação de dados para Fine-tuning futuro (Data Flywheel) - [ ] Configurar container Zabbix Agent. - - [ ] Modelar pipeline de exportação de dados para Fine-tuning futuro.