Explore Help

/

minions-ai-agents

1

0

You've already forked minions-ai-agents

Code Issues Pull Requests Packages Projects Releases Wiki Activity

minions-ai-agents/.gemini/TODO_Arthur.md

4.7 KiB

Raw Blame History

TODO - Projeto Arthur (Agente de Suporte Técnico N2)

Este documento serve como o roteiro técnico detalhado para a implementação do Agente Arthur. O foco é soberania (local-only), otimização de CPU e integração auditável via e-mail.

Fase 1: Planejamento e Arquitetura de Dados ✅

Consolidação do PRD N2: Definição de escopo, hardware e lógica de atendimento.
Mapeamento do Tenant Resolver (Financeiro):
- MockFinancialClient implementado em src/clients/mock_financial.py
- Esquema Pydantic TenantContext em src/models/tenant.py
Design do Schema de Auditoria:
- Modelo AuditLog em src/models/audit.py (PostgreSQL)
- Migrations em src/database/migrations.py
Mapeamento de Segredos:
- SecretsManager em src/security/secrets_manager.py
- Suporte a Docker Secrets + variáveis de ambiente

Fase 2: Infraestrutura e Conectores Core ✅

Ambiente de Inferência Local:
- OllamaClient em src/clients/ollama_client.py
- Suporte a Llama 3.2 1B (Triagem) e Llama 3.1 8B (Especialista)
Configuração do Qdrant Multitenant:
- QdrantMultitenant em src/clients/qdrant_client.py
- Persistência on_disk: true + filtro por tenant_id
Conector Zabbix API:
- ZabbixConnector em src/clients/zabbix_connector.py
- Funções: get_host_status, get_active_problems, get_neighbor_alerts
Segurança de Infraestrutura:
- Docker Secrets configurado
- DLPFilter em src/security/dlp_filter.py (redação de CPF/CNPJ/senhas)
Módulo de Comunicação (Mail Client):
- ⏳ Aguardando senha do email arthur.servicedesk@itguys.com.br

Fase 3: Orquestração e Raciocínio (Cérebro) ✅

Implementação do Agente de Triagem (1B):
- TriageAgent em src/agents/triage_agent.py
- Prompt Engineering para extração de entidades + fallback regex
- Classificação de prioridade/categoria
Implementação do Agente Especialista (8B):
- SpecialistAgent em src/agents/specialist_agent.py
- Coleta de contexto Zabbix + RAG
- Geração de diagnóstico e resposta
Pipeline de Processamento:
- TicketPipeline em src/agents/pipeline.py
- Orquestração triage → specialist → audit
Desenvolvimento do Multi-Agent Dispatcher:
- MultiAgentDispatcher em src/agents/dispatcher.py
- State machine: RECEIVED → TRIAGING → ENRICHING → ANALYZING → VALIDATING → RESPONDING
- Integração com RateLimiter
Rate Limiter por Tenant:
- RateLimiter em src/agents/rate_limiter.py
- Sliding window (por minuto/hora)
- Limite de requisições simultâneas
- Prioridade por tier de cliente
Camada de Validação e Segurança (Self-Correction):
- SelfCorrectionLayer em src/agents/validators.py
- Validação de domínios permitidos
- Bloqueio de comandos perigosos (rm -rf, DROP DATABASE, etc.)
- Threshold de confiança com escalação automática
Desenvolvimento do Analista de Causa Raiz:
- RootCauseAnalyzer em src/agents/root_cause_analyzer.py
- Correlação de alertas por similaridade e keywords
- Detecção de problemas de infraestrutura compartilhada

Fase 4: Flywheel e Qualidade (Aprendizado) ✅

Pipeline de Ingestão de RAG:
- RAGIngestionPipeline em src/flywheel/rag_pipeline.py
- Processamento de Markdown/TXT, chunking e indexação Qdrant
- Sanitização de conteúdo (remoção de scripts, base64)
- Detecção automática de tecnologia
Parser de Feedback de Encerramento:
- FeedbackParser em src/flywheel/feedback_parser.py
- Detecta: Resolvido, Reaberto, Escalação, Esclarecimento
- Análise de sentimento e satisfação
Módulo de Memória Episódica:
- EpisodicMemory em src/flywheel/episodic_memory.py
- Armazenamento de lições aprendidas
- Antipadrões (o que NÃO fazer)
- Busca por similaridade

Fase 5: Implantação e Monitoramento

Configuração do Langfuse Local:
- Subir Langfuse via Docker para rastreamento (tracing) de todos os chamados.
Teste de Stress e Latência:
- Validar tempo de resposta com 5+ chamados simultâneos (Contenção de CPU Xeon).
Homologação com Sistema Financeiro:
- Validar a busca dinâmica de clientes em tempo real.

Diretrizes para Agentes de Execução:

CPU Only: Nunca tente usar bibliotecas que exijam CUDA/GPU sem autorização expressa.
Auditabilidade: Toda decisão do Arthur deve gerar um log no PostgreSQL.
Isolamento: Garanta que os dados da ENSEG nunca vazem para um diagnóstico da OESTEPAN via filtros de Payload no Qdrant.

Powered by Gitea Version: 1.21.10 Page: 172ms Template: 5ms

English

Bahasa Indonesia Deutsch English Español Français Italiano Latviešu Magyar nyelv Nederlands Polski Português de Portugal Português do Brasil Suomi Svenska Türkçe Čeština Ελληνικά Български Русский Українська فارسی മലയാളം 日本語简体中文繁體中文（台灣）繁體中文（香港） 한국어

Licenses API

Powered by TurnKey Linux.