Memória Autocorretiva em Agentes de IA Locais: Abordagem com Markdown

Arquitetura de Memória para Agentes de IA Persistentes

Um desenvolvedor no r/LocalLLaMA compartilhou sua abordagem para criar agentes de IA que não repetem erros entre sessões. O problema central abordado é que cada sessão começa do zero, com janelas de contexto sendo redefinidas e correções sendo perdidas entre as sessões.

Implementação da Memória

O sistema usa markdown como fonte da verdade em vez de um banco de dados. MEMORY.md é editável por humanos - exclua uma linha no vim e o agente esquece. SQLite e FAISS (HNSW, 768-dimensões) são caches derivados que podem ser reconstruídos a partir do markdown a qualquer momento. Isso permite que os usuários controlem a versão da memória do seu agente com git.

Pontuação de Episódios e Aprendizado de Regras

Cada execução recebe uma pontuação +1/-1 e é salva como um episódio. Em tarefas futuras similares, episódios relevantes são trazidos para o contexto. Quando a mesma assinatura de erro (SHA256 do nome da ferramenta + erro normalizado) aparece duas vezes dentro de 7 dias, um aprendiz de regras gera uma regra de prevenção de uma linha.

As regras começam com 0.40 de confiança e precisam de 0.60 para realmente serem injetadas em prompts futuros. O sucesso aumenta a confiança em +0.03, o fracasso reduz em -0.05. Regras que não ajudam eventualmente decaem.

Sistema de Escalonamento de Confiança

Em vez de configurar níveis de permissão antecipadamente, o agente rastreia padrões de aprovação. 5 aprovações com taxa de 90%+ = promoção automática. Uma reversão = rebaixamento de volta. Há um modo sombra para auditoria.

Decomposição de Tarefas e Segurança

Objetivos complexos se tornam um DAG (Grafo Acíclico Direcionado). Dependências circulares são detectadas via ordenação topológica, falhas se propagam para dependentes via DFS (Busca em Profundidade). Um portão de conclusão verifica 18 requisitos (R01-R18) - o agente realmente leu os arquivos, escreveu alterações, verificou resultados, permaneceu no workspace?

Recursos de segurança incluem 43 padrões de risco bash, análise de dupla passagem (cru + decodificado), design fail-closed (falha do Guardião = negação) e profundidade mínima gravável de 3 para prevenir rm -rf /.

O desenvolvedor está buscando feedback sobre se o decaimento de confiança nas regras parece correto e se a assimetria +0.03/-0.05 é ideal. Também está se perguntando se há alternativas melhores ao HNSW para esta escala (tipicamente <10k episódios).

📖 Read the full source: r/LocalLLaMA