AgentWorkingMemory: Um Sistema de Memória Local para Agentes de IA de Codificação

O que o AgentWorkingMemory Resolve
Agentes de codificação de IA como o Claude Code não têm memória persistente entre sessões. Os desenvolvedores acabam tendo que reexplicar arquitetura, esquemas de banco de dados e decisões anteriores toda vez que iniciam uma nova sessão, desperdiçando tempo e espaço na janela de contexto. Embora o Claude Code ofereça algumas ferramentas como --continue para retomar conversas, memória automática que salva notas em arquivos markdown e documentação de projeto CLAUDE.md, essas soluções têm limitações:
--continueou--resumerestauram threads de conversa inteiras, mas consomem espaço na janela de contexto e só funcionam com uma thread por vez- A memória automática carrega as primeiras 200 linhas de
MEMORY.md, mas falta inteligência de recuperação—ela não sabe quais notas são relevantes para o trabalho atual - Documentos de projeto como
CLAUDE.mdfuncionam para informações estáveis, mas ficam desatualizados rapidamente em projetos em evolução acelerada
O AgentWorkingMemory aborda esses problemas acumulando conhecimento entre sessões, trazendo contexto relevante para o trabalho atual e melhorando com o tempo sem gerenciamento manual.
Como Funciona
O AWM funciona inteiramente localmente na sua máquina sem dependências de nuvem. O sistema consiste em:
- Um banco de dados SQLite para armazenamento
- Três modelos de ML locais (~124MB no total, baixados uma vez e armazenados em cache)
- Um processo Node.js
Não há servidor para executar, nem contêiner Docker, nem daemon em segundo plano. Quando você inicia o Claude Code, ele automaticamente inicia o AWM através do MCP (Model Context Protocol). Quando você fecha a sessão, ele para. Tudo permanece local—sem nuvem, sem chaves de API, sem dados saindo da sua máquina. Para segurança extra, o AWM suporta autenticação por token bearer para bloquear o acesso à API de memória.
Configuração e Uso
A instalação requer dois comandos:
npm install -g agent-working-memory
awm setup --globalApós reiniciar o Claude Code, 14 ferramentas de memória aparecem automaticamente. A primeira sessão leva cerca de 30 segundos enquanto os modelos de ML são baixados (~124MB, armazenados em cache depois disso). A partir desse ponto:
- O agente grava memórias quando aprende algo importante
- Ele recupera memórias relevantes ao iniciar novos trabalhos
- Ele faz checkpoints do seu estado para recuperação após interrupções
O sistema foi desenvolvido durante a reconstrução de uma base de código de 20 anos (~1,4 milhão de linhas) para uma stack moderna (~250K linhas estimadas), especificamente para uma plataforma de gerenciamento de membros com 88 tabelas de banco de dados e desenvolvimento multi-sprint usando múltiplos agentes de IA em paralelo.
📖 Read the full source: r/ClaudeAI
👀 See Also

Universal CLAUDE.md reduz os tokens de saída do Claude em 63% em benchmarks
Um desenvolvedor criou um arquivo universal CLAUDE.md que reduz a saída de tokens do Claude em 63% em cinco testes de referência, mantendo a precisão técnica. O arquivo aborda comportamentos comuns do Claude, como respostas verbosas, formatação desnecessária e sugestões não solicitadas.

Strale.io oferece uma API gratuita de validação de IBAN e e-mail para agentes de IA, sem necessidade de cadastro.
Strale.io oferece uma API gratuita com cinco funcionalidades, incluindo validação de IBAN, validação de e-mail, consulta de DNS, conversão de URL para markdown e reparo de JSON. Não é necessário cadastro ou chave de API, e inclui um servidor MCP para integração com Claude ou Cursor.

Painel de Código Aberto Revela Custos Reais de Computação do Claude Code
Um desenvolvedor engenhou reversamente a fórmula de limite de taxa do Claude Code para construir um painel local que mostra a porcentagem de uso em tempo real, custos reais em dólares, taxa de consumo, horários de pico e quais habilidades/hooks estão sendo acionados. A ferramenta revelou que um plano de US$ 100/mês consumiu US$ 13.286 em computação de API equivalente em um mês.

O plugin de código aberto do Claude gera sintonizadores visuais interativos com pré-visualização em tempo real
Um desenvolvedor criou um plugin de código aberto que permite ao Claude Code gerar páginas HTML únicas com controles deslizantes e telas infinitas no estilo Figma para ajustar valores CSS. O plugin lê arquivos de origem, reproduz elementos em uma tela interativa e fornece controles para ajustes precisos com visualização em tempo real.