Gerenciando Contexto de IA com um Armazenamento de Conhecimento SQLite e Ferramentas MCP

Um ponto problemático comum com agentes de codificação de IA: os arquivos CLAUDE.md crescem para milhares de linhas, consumindo orçamento de contexto e fazendo com que a IA ignore metade das regras de qualquer maneira. Um desenvolvedor no r/ClaudeAI construiu um sistema para resolver isso — RunawayContext (licenciado sob MIT, atualmente usado para integrações de gestão de construção na Vista, Procore, Monday.com, etc.).
Arquitetura
A ideia central: mover conhecimento profundo de um arquivo markdown simples para um banco de dados SQLite com busca em texto completo (FTS5) e busca vetorial opcional via sqlite-vec. Em vez de carregar tudo a cada sessão, apenas um pequeno resumo por projeto (~150 linhas), uma constituição global (~200 linhas) e uma "memória viva" baseada em ponteiros (~50 linhas) são carregados antecipadamente. A IA consulta o banco de dados sob demanda usando ferramentas MCP como search_lessons e get_chunk.
Detalhes Chave de Implementação
- Matemática de tokens: O equivalente a ~280K tokens ainda existe — eles estão apenas no banco de dados, não carregados no contexto. A IA puxa o que precisa no meio da tarefa.
- Limites fixos em código: O regenerador recusa escrever um resumo que ultrapasse seu limite de 150 linhas. 15 regras arquiteturais nomeadas têm testes de CI associados que falham na build se a regra se desviar.
- Recuperação híbrida: A busca apenas vetorial foi pior que a híbrida. O sistema combina pontuações de palavras-chave FTS5 com pontuações vetoriais do sqlite-vec para obter melhores resultados.
- Humano no loop: A IA escreve novas lições em uma caixa de entrada de rascunhos. Um humano deve aprovar antes da promoção para o repositório de conhecimento, evitando ruído.
- Voz preservada: Os resumos gerados automaticamente contêm um bloco curado manualmente, delimitado por marcadores
<!-- PRESERVE_START -->. O regenerador mantém essa seção intacta enquanto regenera tudo ao redor.
Lições Aprendidas
- Imponha regras em código, não em política — toda instrução de "cuidado para não crescer" foi violada em poucos meses.
- A recuperação híbrida FTS5 + vetorial supera a busca apenas vetorial.
- Escritas diretas da IA no repositório de conhecimento introduzem ruído; use uma caixa de entrada de rascunhos com aprovação manual.
O sistema é agnóstico em relação ao agente e o repositório é público para qualquer um adaptar.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

AI Claw: Ponte sem Servidor Conecta Alexa ao OpenClaw Local com Entrega Dupla
AI Claw é um pipeline Python AWS Lambda que conecta alto-falantes Amazon Echo a instâncias locais do OpenClaw, contornando o tempo limite de 8 segundos da Amazon usando uma arquitetura fire-and-forget com entrega dupla para o Telegram e saída de áudio nativa do Echo.

Framework de código aberto para memória persistente de agentes de IA com armazenamento local e recuperação baseada em grafos
Um desenvolvedor está construindo um framework de código aberto para memória persistente de agentes de IA que armazena dados localmente como arquivos Markdown, usa wiki-links como arestas de grafo e implementa Git para controle de versão. O sistema apresenta recuperação de quatro sinais e esquecimento consciente do grafo baseado na ciência cognitiva ACT-R.

Habilidade de autocura de código aberto para agentes de IA detecta e corrige falhas automaticamente.
Uma nova habilidade de código aberto permite que agentes de IA detectem automaticamente falhas, diagnostiquem causas raiz e implementem correções. Inclui um scanner de falhas para crons, subagentes e logs de implantação, além de um banco de dados que aprende com correções anteriores.

Claude adiciona recurso de importação de memória para migrar de outros provedores de IA
O Claude agora permite que os usuários importem contexto e preferências de outros provedores de IA através de um processo de copiar e colar. O recurso de memória está disponível em todos os planos pagos e ajuda a manter o histórico de conversas ao alternar entre plataformas.