Forge: Sistema de Memória para Claude Code com 6 Estágios

O que o Forge faz

Um desenvolvedor usou o Claude Code para construir o Forge, uma ferramenta que resolve o problema de memória baseada em sessão do Claude Code. O Forge é um monorepo TypeScript com 6 pacotes que funciona como um servidor MCP. Ele processa cada turno de conversa através de um pipeline estruturado para capturar e persistir o contexto do projeto.

Como funciona

O sistema usa um pipeline de seis estágios:

Classificar — Determina se uma declaração é uma decisão, restrição, rejeição, exploração, objetivo, correção ou ruído.
Extrair — Extrai dados estruturados incluindo a declaração, racional, categoria e nível de certeza.
Modelar — Escreve em um modelo de projeto com origem em eventos (SQLite somente de acréscimo que nunca perde o histórico).
Propagar — Verifica conflitos entre decisões e restrições.
Superficiar — Notifica sobre tensões com detecção de estado de fluxo para evitar interrupções constantes.
Executar — Conecta-se ao GitHub para criar issues, repositórios e especificações de commit baseadas em decisões.

Uma regra de design fundamental imposta pelo Claude Code: uma decisão que passa de "inclinando-se" para "decidida" nunca é automática. Você deve explicitamente confirmar. Testes reforçam essa invariante.

Detalhes de desenvolvimento

A construção envolveu vários desafios técnicos interessantes:

Pipeline de LLM em dois estágios — O próprio Forge chama LLMs para classificar e extrair decisões da conversa, criando um cenário tipo "inception" onde o Claude Code escreve código que chama o Claude. Conseguir prompts certos para classificação confiável exigiu iteração significativa.
Implementação de origem em eventos — Cada decisão, restrição e rejeição é um evento somente de acréscimo no SQLite. Nada é excluído ou sobrescrito, permitindo a reprodução de todo o histórico de decisões.
Sistema de calibração de confiança — O Forge rastreia com que frequência suas classificações estão corretas e ajusta seu limite de interrupção. Se tem estado errado frequentemente, fica mais quieto. O Claude Code construiu o rastreamento de confiança, orçamentos de interrupção e detecção de estado de fluxo.
Testes — O projeto inclui 170 testes em 14 arquivos de teste que capturaram bugs reais durante o desenvolvimento, particularmente em torno da lógica de propagação de restrições.

Integração com o Cortex

O Forge combina com outra ferramenta chamada Cortex (também construída com Claude Code), um grafo de conhecimento que indexa sua base de código. Quando ambos são instalados como servidores MCP, o Forge consulta automaticamente o Cortex durante a extração. Por exemplo, se você disser "vamos mudar para PostgreSQL", o Forge verifica no Cortex referências de banco de dados existentes, serviços relacionados e padrões de migração antes de registrar a decisão.

As ferramentas são complementares: o Forge sabe por quê (decisões, restrições, intenção, rejeições) enquanto o Cortex sabe o quê (entidades de código, padrões, dependências, arquitetura).

Uso prático

Você instala o Forge como um servidor MCP em seu projeto, então conversa com o Claude Code normalmente. Nos bastidores, o Forge classifica cada turno, extrai decisões e constrói um modelo persistente. Em sessões subsequentes, o Claude Code pode verificar forge://brief para ver instantaneamente o que foi decidido, o que ainda está aberto, o que foi explicitamente rejeitado e onde há tensões ativas.

📖 Leia a fonte completa: r/ClaudeAI