docs: Adiciona novos campos e detalhes de otimização GGUF/RAG
Porque foi feita essa alteração? Inclusão dos campos tipoOperacao, tipoTransacao e titulo no schema da API. Detalhamento do requisito de uso de modelo quantizado (GGUF) e estratégia de ranking no RAG para performance. Quais testes foram feitos? Revisão textual. A alteração gerou um novo teste? Não.
This commit is contained in:
parent
016334d700
commit
1e3b0c4ab4
|
|
@ -31,7 +31,10 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel
|
||||||
- `idTransacao` (varchar 1000): Identificador único da transação na origem.
|
- `idTransacao` (varchar 1000): Identificador único da transação na origem.
|
||||||
- `dataEntrada` (date): Data de competência da transação.
|
- `dataEntrada` (date): Data de competência da transação.
|
||||||
- `descricao` (varchar 500): Texto descritivo da transação bancária.
|
- `descricao` (varchar 500): Texto descritivo da transação bancária.
|
||||||
- **Nota:** O campo de Valor foi removido nesta fase para evitar vieses em ambientes multi-empresa, focando a classificação puramente na semântica da descrição.
|
- `tipoOperacao` (varchar 500): Indicador de entrada/saída (ex: 'C'/'D', 'Crédito'/'Débito').
|
||||||
|
- `tipoTransacao` (varchar 500): Método da transação (ex: 'pix', 'pagamento', 'boleto', 'débito').
|
||||||
|
- `titulo` (varchar 500): Título amigável da transação (ex: "Pix Enviado", "Boleto Pago").
|
||||||
|
- **Nota:** O campo de Valor foi removido para evitar vieses. O modelo usará a descrição combinada com os tipos e título para categorização.
|
||||||
|
|
||||||
#### 4.2 Motor de Classificação (Core AI - RAG + LLM Local)
|
#### 4.2 Motor de Classificação (Core AI - RAG + LLM Local)
|
||||||
- **Estratégia:**
|
- **Estratégia:**
|
||||||
|
|
@ -53,10 +56,11 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel
|
||||||
### 6. Stack Tecnológica Definida
|
### 6. Stack Tecnológica Definida
|
||||||
- **Linguagem:** Python (Versão travada: 3.12.1).
|
- **Linguagem:** Python (Versão travada: 3.12.1).
|
||||||
- **Framework:** A definir (LangChain ou implementação customizada leve).
|
- **Framework:** A definir (LangChain ou implementação customizada leve).
|
||||||
- **LLM:** Llama 3 (versão otimizada para CPU/Local, ex: GGUF/Ollama se aplicável).
|
- **LLM:** Llama 3 Local (via `llama-cpp-python`).
|
||||||
- **Base de Dados:**
|
- **Otimização:** Uso obrigatório de formato **GGUF com Quantização** (ex: Q4_K_M ou Q5_K_M) para reduzir uso de RAM (< 6GB) e latência.
|
||||||
- **Relacional:** PostgreSQL (para dados estruturados, logs, ponteiros).
|
- **Base de Dados e RAG:**
|
||||||
- **Vetorial:** Solução integrada ou leve para RAG, indexando descrições e classificações históricas.
|
- **Relacional:** PostgreSQL.
|
||||||
|
- **Vetorial (RAG):** ChromaDB com estratégia de **Ranking/Reranking**. O retriever deve pré-filtrar ou ordenar candidatos não apenas por similaridade bruta, mas priorizando exemplos com alta confiança histórica para acelerar a convergência da resposta correta.
|
||||||
|
|
||||||
### 7. Fluxo de Execução
|
### 7. Fluxo de Execução
|
||||||
1. **Trigger:** Aplicação externa envia transação via API para o Agente.
|
1. **Trigger:** Aplicação externa envia transação via API para o Agente.
|
||||||
|
|
|
||||||
Loading…
Reference in New Issue