Refletir Servidor MCP Implementa Documento de Reflexão para Memória Persistente de Agente de Codificação

Um desenvolvedor implementou o artigo Reflexion (Shinn et al., NeurIPS 2023) como um servidor MCP para resolver um problema comum com agentes de codificação locais: a falta de memória persistente entre sessões. A ferramenta, chamada reflect-mcp, permite que os agentes lembrem e evitem repetir erros.
Como Funciona
O sistema opera através de um fluxo de trabalho estruturado:
- Após cada falha de teste, o agente critica seu próprio trabalho e extrai padrões do erro
- Essas lições são armazenadas para referência futura
- Antes de iniciar novas tarefas, o agente recupera lições passadas usando busca de texto completo
- A correspondência de padrões é totalmente baseada em regex - nenhuma chamada de LLM é necessária para classificação
O desenvolvedor observa que as mensagens de erro são previsíveis o suficiente para que a correspondência determinística funcione efetivamente. O agente escreve a crítica porque tem o contexto, enquanto o servidor cuida da estruturação e deduplicação das lições.
Implementação Técnica
- Construído como um servidor MCP (Model Context Protocol)
- Usa SQLite com FTS5 para armazenamento e busca
- Funciona com qualquer cliente compatível com MCP
- Instale via:
cargo install reflect-mcp
Resultados Após Uma Semana
O desenvolvedor relatou várias melhorias no comportamento do seu agente de codificação:
- Parou de fazer o mesmo
unwrap()em entrada do usuário - Parou de esquecer o tratamento de fuso horário
- Começou a evitar automaticamente padrões de falha previamente vistos
- O rastreamento de padrões tornou visíveis erros recorrentes em todo o projeto
O projeto está disponível no GitHub em https://github.com/rohansx/reflect. O desenvolvedor está buscando feedback de outros que experimentaram configurações de memória persistente para agentes de codificação locais.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Monarch v3: Paginação KV Inspirada no NES para Inferência de LLM 78% Mais Rápida
O Monarch v3 implementa paginação de memória inspirada no NES para transformers, alcançando inferência 78% mais rápida (17,01 para 30,42 tok/seg) em um modelo de 1,1B de parâmetros com sobrecarga de VRAM quase zero. O algoritmo de código aberto divide o cache KV em regiões quentes e frias com mecanismos de compressão e promoção.

Extensão Codex Chrome Adiciona Automação de Navegador em Segundo Plano entre Abas
A nova extensão do Codex para Chrome no macOS/Windows permite a execução paralela de tarefas no navegador em abas de fundo sem assumir o controle — abrangendo fluxos de debug, painéis, pesquisa e atualizações de CRM.

Gerenciador de Projetos Local no Estilo Trello para Agentes OpenClaw
Um desenvolvedor construiu uma ferramenta local de gerenciamento de projetos semelhante ao Trello que roda na mesma máquina que seu agente OpenClaw, armazenando cartões como arquivos markdown com frontmatter YAML. O sistema usa Node.js/Express para a API, React para a interface e permite que o agente de IA leia/escreva arquivos diretamente no sistema de arquivos.

Carregador Dinâmico de Workers da Cloudflare: Isolando Agentes de IA com Isolates
A API Dynamic Worker Loader da Cloudflare, agora em beta aberto, permite que Workers instanciem novos Workers com código especificado em tempo de execução em sandboxes isolados usando isolados V8, oferecendo inicialização 100x mais rápida do que contêineres e sem limites globais de simultaneidade.