3.9 KiB

Raw Blame History

PRD - Product Requirements Document

Agente de IA para Classificação de Transações Bancárias

1. Visão Geral

Este documento define os requisitos para o desenvolvimento de um Agente de Inteligência Artificial especializado na análise, categorização e classificação de transações bancárias. O objetivo é automatizar o processo de conciliação financeira, transformando dados brutos de extratos em informações organizadas e acionáveis.

2. Objetivos do Produto

Automação: Reduzir em 90% o trabalho manual de classificação de lançamentos financeiros.
Precisão: Alcançar uma taxa de assertividade superior a 95% na categorização automática.
Inteligência: Identificar padrões de recorrência e anomalias (possíveis fraudes ou erros).
Escalabilidade: Capaz de processar milhares de transações em segundos.

3. Escopo

3.1 Incluso

Leitura de extratos bancários em formatos padrão (OFX, CSV, Excel, PDF).
Processamento de Linguagem Natural (NLP) para entender descrições de transações (ex: "IFOOD *BR" -> "Alimentação").
Aprendizado contínuo com feedback do usuário.
Geração de relatórios categorizados.

3.2 Não Incluso (nesta fase)

Integração direta via API bancária (Open Finance) - Fase 2.
Execução de pagamentos ou transferências.
Gestão de fluxo de caixa (Dashboard financeiro complexo).

4. Funcionalidades Principais

4.1 Ingestão de Dados

O sistema deve aceitar arquivos de upload contendo extratos bancários.

Entrada: Arquivos .csv, .xlsx, .ofx.
Processamento: Normalização de datas, valores e descrições.

4.2 Motor de Classificação (Core AI)

O agente deve analisar a descrição da transação e atribuir uma:

Categoria Principal (ex: Despesas Administrativas).
Sub-categoria (ex: Material de Escritório).
Tags opcionais (ex: #reembolsavel, #projeto-alpha).

Exemplos de mapeamento:

UBER DO BRASIL -> Transporte
AWS EMEA -> Infraestrutura / Cloud
PAGTO ELETRON COBRANCA -> Tarifas Bancárias

4.3 Detecção de Padrões e Anomalias

Vencimentos Recorrentes: Identificar pagamentos que se repetem mensalmente.
Anomalias: Alertar sobre valores muito acima da média para um determinado fornecedor.

4.4 Interface de Correção (Human-in-the-loop)

O sistema deve apresentar as classificações com um "Score de Confiança".

Baixa confiança (< 70%): Solicitar revisão manual.
Alta confiança (> 90%): Aprovação automática (configurável).

5. Requisitos Não Funcionais

Privacidade: Dados sensíveis devem ser anonimizados antes de serem processados por LLMs externos, se aplicável.
Performance: Tempo de resposta < 2 segundos por transação em lote.
Portabilidade: Deve rodar localmente ou em container Docker.

6. Stack Tecnológica Sugerida

Linguagem: Python 3.10+
Framework de Agentes: CrewAI, LangChain ou Phidata.
LLM: OpenAI GPT-4o, Anthropic Claude 3.5 Sonnet (para raciocínio complexo) ou modelos locais (Llama 3, Mistral) para privacidade.
Base de Dados: PostgreSQL ou SQLite para armazenamento estruturado; ChromaDB ou Qdrant para busca semântica (RAG) de históricos de classificação.

7. Fluxo de Execução (High-Level)

Input: Usuário envia extrato.csv.
Parser: Script converte para JSON padronizado.
Agent:
- Consulta base vetorial para ver se já classificou algo similar antes (Few-Shot Learning).
- Se não, usa LLM para inferir categoria baseada na descrição.
Output: JSON/CSV enriquecido com colunas Categoria, Subcategoria e Confiança.
Feedback: Usuário corrige/valida e o sistema salva o exemplo para futuro fine-tuning/RAG.

8. Próximos Passos

Definir a taxonomia padrão de categorias (Plano de Contas).
Criar dataset de validação (Golden Dataset).
Implementar MVP com script Python simples e chamada de API LLM.

3.9 KiB Raw Blame History