Abordagem para a Memória Autocorretiva em Agentes de IA Locais

Arquitetura de Memória para Agentes de IA Persistentes
Um desenvolvedor no r/LocalLLaMA compartilhou sua abordagem para criar agentes de IA que não repetem erros entre sessões. O problema central abordado é que cada sessão começa do zero, com janelas de contexto sendo redefinidas e correções sendo perdidas entre as sessões.
Implementação da Memória
O sistema usa markdown como fonte da verdade em vez de um banco de dados. MEMORY.md é editável por humanos - exclua uma linha no vim e o agente esquece. SQLite e FAISS (HNSW, 768-dimensões) são caches derivados que podem ser reconstruídos a partir do markdown a qualquer momento. Isso permite que os usuários controlem a versão da memória do seu agente com git.
Pontuação de Episódios e Aprendizado de Regras
Cada execução recebe uma pontuação +1/-1 e é salva como um episódio. Em tarefas futuras similares, episódios relevantes são trazidos para o contexto. Quando a mesma assinatura de erro (SHA256 do nome da ferramenta + erro normalizado) aparece duas vezes dentro de 7 dias, um aprendiz de regras gera uma regra de prevenção de uma linha.
As regras começam com 0.40 de confiança e precisam de 0.60 para realmente serem injetadas em prompts futuros. O sucesso aumenta a confiança em +0.03, o fracasso reduz em -0.05. Regras que não ajudam eventualmente decaem.
Sistema de Escalonamento de Confiança
Em vez de configurar níveis de permissão antecipadamente, o agente rastreia padrões de aprovação. 5 aprovações com taxa de 90%+ = promoção automática. Uma reversão = rebaixamento de volta. Há um modo sombra para auditoria.
Decomposição de Tarefas e Segurança
Objetivos complexos se tornam um DAG (Grafo Acíclico Direcionado). Dependências circulares são detectadas via ordenação topológica, falhas se propagam para dependentes via DFS (Busca em Profundidade). Um portão de conclusão verifica 18 requisitos (R01-R18) - o agente realmente leu os arquivos, escreveu alterações, verificou resultados, permaneceu no workspace?
Recursos de segurança incluem 43 padrões de risco bash, análise de dupla passagem (cru + decodificado), design fail-closed (falha do Guardião = negação) e profundidade mínima gravável de 3 para prevenir rm -rf /.
O desenvolvedor está buscando feedback sobre se o decaimento de confiança nas regras parece correto e se a assimetria +0.03/-0.05 é ideal. Também está se perguntando se há alternativas melhores ao HNSW para esta escala (tipicamente <10k episódios).
📖 Read the full source: r/LocalLLaMA
👀 See Also

Agente OpenClaw Mantém Memória ao Mudar da Assinatura Claude para a API
Um desenvolvedor relata ter migrado com sucesso sua configuração do OpenClaw de uma assinatura do Claude para uma chave de API sem perder a memória do agente, usando a habilidade mengram-memory que salva em uma camada externa. O agente reteve ~100+ fatos aprendidos, procedimentos evoluídos e memórias episódicas.

Qwen2-0.5B Ajustado para Automação de Tarefas Locais com llama.cpp
Um desenvolvedor ajustou o Qwen2-0.5B para automação de tarefas usando LoRA em aproximadamente 1000 exemplos personalizados, criando um modelo GGUF de 300MB que roda localmente na CPU via llama.cpp. O modelo recebe tarefas em linguagem natural, detecta os tipos de tarefa e gera planos de execução com comandos CLI e atalhos de teclado.

Agent Forge: Ferramenta de Código Aberto Estrutura Pipelines de Múltiplos Agentes para Claude Code
Agent Forge é uma habilidade do Claude Code que gera pipelines completos de múltiplos agentes a partir de descrições de casos de uso. Ele cria arquivos de prompt, scripts de orquestração, diretórios de fluxo de dados e configurações do GitHub Actions com base em padrões observados em sistemas de múltiplos agentes existentes.

Nyx: Plataforma Autônoma de Testes para Agentes de IA
Nyx é uma estrutura de teste de caixa preta que investiga agentes de IA em busca de modos de falha, como bugs lógicos, falhas de raciocínio e vulnerabilidades de segurança, por meio de conversas adaptativas de múltiplos turnos. Ele testa em menos de 10 minutos o que auditorias manuais levam horas para revelar.