Forge: Um Sistema de Memória para Claude Code Construído com Claude Code

O que o Forge faz
Um desenvolvedor usou o Claude Code para construir o Forge, uma ferramenta que resolve o problema de memória baseada em sessão do Claude Code. O Forge é um monorepo TypeScript com 6 pacotes que funciona como um servidor MCP. Ele processa cada turno de conversa através de um pipeline estruturado para capturar e persistir o contexto do projeto.
Como funciona
O sistema usa um pipeline de seis estágios:
- Classificar — Determina se uma declaração é uma decisão, restrição, rejeição, exploração, objetivo, correção ou ruído.
- Extrair — Extrai dados estruturados incluindo a declaração, racional, categoria e nível de certeza.
- Modelar — Escreve em um modelo de projeto com origem em eventos (SQLite somente de acréscimo que nunca perde o histórico).
- Propagar — Verifica conflitos entre decisões e restrições.
- Superficiar — Notifica sobre tensões com detecção de estado de fluxo para evitar interrupções constantes.
- Executar — Conecta-se ao GitHub para criar issues, repositórios e especificações de commit baseadas em decisões.
Uma regra de design fundamental imposta pelo Claude Code: uma decisão que passa de "inclinando-se" para "decidida" nunca é automática. Você deve explicitamente confirmar. Testes reforçam essa invariante.
Detalhes de desenvolvimento
A construção envolveu vários desafios técnicos interessantes:
- Pipeline de LLM em dois estágios — O próprio Forge chama LLMs para classificar e extrair decisões da conversa, criando um cenário tipo "inception" onde o Claude Code escreve código que chama o Claude. Conseguir prompts certos para classificação confiável exigiu iteração significativa.
- Implementação de origem em eventos — Cada decisão, restrição e rejeição é um evento somente de acréscimo no SQLite. Nada é excluído ou sobrescrito, permitindo a reprodução de todo o histórico de decisões.
- Sistema de calibração de confiança — O Forge rastreia com que frequência suas classificações estão corretas e ajusta seu limite de interrupção. Se tem estado errado frequentemente, fica mais quieto. O Claude Code construiu o rastreamento de confiança, orçamentos de interrupção e detecção de estado de fluxo.
- Testes — O projeto inclui 170 testes em 14 arquivos de teste que capturaram bugs reais durante o desenvolvimento, particularmente em torno da lógica de propagação de restrições.
Integração com o Cortex
O Forge combina com outra ferramenta chamada Cortex (também construída com Claude Code), um grafo de conhecimento que indexa sua base de código. Quando ambos são instalados como servidores MCP, o Forge consulta automaticamente o Cortex durante a extração. Por exemplo, se você disser "vamos mudar para PostgreSQL", o Forge verifica no Cortex referências de banco de dados existentes, serviços relacionados e padrões de migração antes de registrar a decisão.
As ferramentas são complementares: o Forge sabe por quê (decisões, restrições, intenção, rejeições) enquanto o Cortex sabe o quê (entidades de código, padrões, dependências, arquitetura).
Uso prático
Você instala o Forge como um servidor MCP em seu projeto, então conversa com o Claude Code normalmente. Nos bastidores, o Forge classifica cada turno, extrai decisões e constrói um modelo persistente. Em sessões subsequentes, o Claude Code pode verificar forge://brief para ver instantaneamente o que foi decidido, o que ainda está aberto, o que foi explicitamente rejeitado e onde há tensões ativas.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Claude Academy: Um Bootcamp de Programação Gratuito que Funciona Dentro do Claude Desktop
Um desenvolvedor criou a Claude Academy, um bootcamp de programação gratuito que opera inteiramente dentro da aba Code do Claude Desktop. O sistema usa três comandos para oferecer 64 lições estruturadas sobre fundamentos de desenvolvimento web, com acompanhamento de progresso e construção de projetos reais.

Agente de IA Local Alcança Latência de STT e TTS em Sub-Segundos com Servidores de Código Aberto
Um desenvolvedor alcançou ~0,2s de latência STT usando Whisper large-v3-turbo com arquitetura híbrida de GPU gerenciada por threads e ~250ms de latência TTS com Coqui-TTS otimizado para síntese de baixa latência. Ambas as implementações são totalmente auto-hospedadas e de código aberto.

Sistema de Memória MCP Local com Consolidação para Conversas de IA
Um desenvolvedor criou um servidor MCP que fornece memória local persistente para clientes de IA, usando Qwen 2.5-7B para consolidar conversas em documentos de conhecimento estruturados a cada 6 horas. O sistema roda completamente no seu hardware com deduplicação semântica, pontuação adaptativa e busca vetorial FAISS.

Altimate Code: Plataforma de Engenharia de Dados Agêntica de Código Aberto
Altimate Code é um harness de código aberto que fornece ferramentas determinísticas de engenharia de dados para agentes de IA, abordando problemas como SQL alucinado e falta de contexto de esquema. Inclui linhagem em nível de coluna, detecção de antipadrões SQL e integração com dbt, com benchmarks mostrando 74,4% de desempenho no ADE-bench.