3.9 KiB
3.9 KiB
PRD - Product Requirements Document
Agente de IA para Classificação de Transações Bancárias
1. Visão Geral
Este documento define os requisitos para o desenvolvimento de um Agente de Inteligência Artificial especializado na análise, categorização e classificação de transações bancárias. O objetivo é automatizar o processo de conciliação financeira, transformando dados brutos de extratos em informações organizadas e acionáveis.
2. Objetivos do Produto
- Automação: Reduzir em 90% o trabalho manual de classificação de lançamentos financeiros.
- Precisão: Alcançar uma taxa de assertividade superior a 95% na categorização automática.
- Inteligência: Identificar padrões de recorrência e anomalias (possíveis fraudes ou erros).
- Escalabilidade: Capaz de processar milhares de transações em segundos.
3. Escopo
3.1 Incluso
- Leitura de extratos bancários em formatos padrão (OFX, CSV, Excel, PDF).
- Processamento de Linguagem Natural (NLP) para entender descrições de transações (ex: "IFOOD *BR" -> "Alimentação").
- Aprendizado contínuo com feedback do usuário.
- Geração de relatórios categorizados.
3.2 Não Incluso (nesta fase)
- Integração direta via API bancária (Open Finance) - Fase 2.
- Execução de pagamentos ou transferências.
- Gestão de fluxo de caixa (Dashboard financeiro complexo).
4. Funcionalidades Principais
4.1 Ingestão de Dados
O sistema deve aceitar arquivos de upload contendo extratos bancários.
- Entrada: Arquivos .csv, .xlsx, .ofx.
- Processamento: Normalização de datas, valores e descrições.
4.2 Motor de Classificação (Core AI)
O agente deve analisar a descrição da transação e atribuir uma:
- Categoria Principal (ex: Despesas Administrativas).
- Sub-categoria (ex: Material de Escritório).
- Tags opcionais (ex: #reembolsavel, #projeto-alpha).
Exemplos de mapeamento:
UBER DO BRASIL-> TransporteAWS EMEA-> Infraestrutura / CloudPAGTO ELETRON COBRANCA-> Tarifas Bancárias
4.3 Detecção de Padrões e Anomalias
- Vencimentos Recorrentes: Identificar pagamentos que se repetem mensalmente.
- Anomalias: Alertar sobre valores muito acima da média para um determinado fornecedor.
4.4 Interface de Correção (Human-in-the-loop)
O sistema deve apresentar as classificações com um "Score de Confiança".
- Baixa confiança (< 70%): Solicitar revisão manual.
- Alta confiança (> 90%): Aprovação automática (configurável).
5. Requisitos Não Funcionais
- Privacidade: Dados sensíveis devem ser anonimizados antes de serem processados por LLMs externos, se aplicável.
- Performance: Tempo de resposta < 2 segundos por transação em lote.
- Portabilidade: Deve rodar localmente ou em container Docker.
6. Stack Tecnológica Sugerida
- Linguagem: Python 3.10+
- Framework de Agentes: CrewAI, LangChain ou Phidata.
- LLM: OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet (para raciocínio complexo) ou modelos locais (Llama 3, Mistral) para privacidade.
- Base de Dados: PostgreSQL ou SQLite para armazenamento estruturado; ChromaDB ou Qdrant para busca semântica (RAG) de históricos de classificação.
7. Fluxo de Execução (High-Level)
- Input: Usuário envia
extrato.csv. - Parser: Script converte para JSON padronizado.
- Agent:
- Consulta base vetorial para ver se já classificou algo similar antes (Few-Shot Learning).
- Se não, usa LLM para inferir categoria baseada na descrição.
- Output: JSON/CSV enriquecido com colunas
Categoria,SubcategoriaeConfiança. - Feedback: Usuário corrige/valida e o sistema salva o exemplo para futuro fine-tuning/RAG.
8. Próximos Passos
- Definir a taxonomia padrão de categorias (Plano de Contas).
- Criar dataset de validação (Golden Dataset).
- Implementar MVP com script Python simples e chamada de API LLM.