From da333b06de38f2cea6fff0c528da69dc92c0bae1 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Jo=C3=A3o=20Pedro=20Toledo?= Date: Wed, 28 Jan 2026 09:47:48 -0300 Subject: [PATCH] docs: Adiciona Monitoramento (Langfuse/Prometheus) ao PRD MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Porque foi feita essa alteração? Inclusão de requisitos de observabilidade lógica (Langfuse) e de infraestrutura (Prometheus/Grafana) conforme diretrizes do documento 'Infraestrutura de Agentes Locais'. Quais testes foram feitos? Revisão textual. A alteração gerou um novo teste? Não. --- .gemini/PRD_Classificacao_Bancaria.md | 8 +++++--- 1 file changed, 5 insertions(+), 3 deletions(-) diff --git a/.gemini/PRD_Classificacao_Bancaria.md b/.gemini/PRD_Classificacao_Bancaria.md index cb2b53b..f30424b 100644 --- a/.gemini/PRD_Classificacao_Bancaria.md +++ b/.gemini/PRD_Classificacao_Bancaria.md @@ -45,9 +45,10 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel 5. **Output:** Retorna classificação validada. - **Resources:** Otimizado para rodar localmente limitando uso de RAM. -#### 4.3 Métricas e Feedback -- **Dashboard de Métricas:** Exposição de dados sobre taxa de acerto e confiança do modelo. -- **Feedback Loop:** O sistema deve permitir que uma aplicação externa envie a correção de uma classificação. Essa correção é salva no banco para refinar futuras buscas RAG. +#### 4.3 Métricas e Observabilidade +- **Monitoramento Lógico (AgentOps):** Uso do **Langfuse** (self-hosted) para rastreamento (tracing) passo a passo de cada inferência, gestão de prompt e custo de tokens. +- **Monitoramento de Infraestrutura:** Uso de **Prometheus + Grafana** (via cAdvisor) para monitorar consumo de CPU/RAM dos containers, garantindo que o agente respeite os limites do hardware local. +- **Feedback Loop:** O sistema deve registrar feedback de usuário como "Scores" no trace do Langfuse para avaliação de qualidade. ### 5. Requisitos Não Funcionais - **Hardware:** Execução exclusiva em CPU. Mínimo consumo de RAM plausível. @@ -57,6 +58,7 @@ Este documento define os requisitos para o desenvolvimento de um Agente de Intel ### 6. Stack Tecnológica Definida - **Linguagem:** Python (Versão travada: 3.12.1). - **Framework:** FastAPI (Exposição) + **PydanticAI** (Validação estrita e Orquestração). +- **Observabilidade:** **Langfuse** (Tracing) + **Prometheus/Grafana** (Métricas). - **LLM:** **Llama 3.2 1B Instruct** Local (GGUF Q4). - **Otimização:** Modelo extremamente leve (< 1GB RAM) rodando via `llama-cpp-python` ou `ollama`. - **Base de Dados e RAG:**