docs: Adiciona novos campos e detalhes de otimização GGUF/RAG

Porque foi feita essa alteração? Inclusão dos campos tipoOperacao, tipoTransacao e titulo no schema da API. Detalhamento do requisito de uso de modelo quantizado (GGUF) e estratégia de ranking no RAG para performance.
Quais testes foram feitos? Revisão textual.
A alteração gerou um novo teste? Não.
This commit is contained in:
João Pedro Toledo Goncalves 2026-01-28 09:36:04 -03:00
parent 016334d700
commit 1e3b0c4ab4
1 changed files with 9 additions and 5 deletions

View File

@ -31,7 +31,10 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel
- `idTransacao` (varchar 1000): Identificador único da transação na origem.
- `dataEntrada` (date): Data de competência da transação.
- `descricao` (varchar 500): Texto descritivo da transação bancária.
- **Nota:** O campo de Valor foi removido nesta fase para evitar vieses em ambientes multi-empresa, focando a classificação puramente na semântica da descrição.
- `tipoOperacao` (varchar 500): Indicador de entrada/saída (ex: 'C'/'D', 'Crédito'/'Débito').
- `tipoTransacao` (varchar 500): Método da transação (ex: 'pix', 'pagamento', 'boleto', 'débito').
- `titulo` (varchar 500): Título amigável da transação (ex: "Pix Enviado", "Boleto Pago").
- **Nota:** O campo de Valor foi removido para evitar vieses. O modelo usará a descrição combinada com os tipos e título para categorização.
#### 4.2 Motor de Classificação (Core AI - RAG + LLM Local)
- **Estratégia:**
@ -53,10 +56,11 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel
### 6. Stack Tecnológica Definida
- **Linguagem:** Python (Versão travada: 3.12.1).
- **Framework:** A definir (LangChain ou implementação customizada leve).
- **LLM:** Llama 3 (versão otimizada para CPU/Local, ex: GGUF/Ollama se aplicável).
- **Base de Dados:**
- **Relacional:** PostgreSQL (para dados estruturados, logs, ponteiros).
- **Vetorial:** Solução integrada ou leve para RAG, indexando descrições e classificações históricas.
- **LLM:** Llama 3 Local (via `llama-cpp-python`).
- **Otimização:** Uso obrigatório de formato **GGUF com Quantização** (ex: Q4_K_M ou Q5_K_M) para reduzir uso de RAM (< 6GB) e latência.
- **Base de Dados e RAG:**
- **Relacional:** PostgreSQL.
- **Vetorial (RAG):** ChromaDB com estratégia de **Ranking/Reranking**. O retriever deve pré-filtrar ou ordenar candidatos não apenas por similaridade bruta, mas priorizando exemplos com alta confiança histórica para acelerar a convergência da resposta correta.
### 7. Fluxo de Execução
1. **Trigger:** Aplicação externa envia transação via API para o Agente.