Armazenamento de Conhecimento SQLite + MCP para Contexto de IA

Um ponto problemático comum com agentes de codificação de IA: os arquivos CLAUDE.md crescem para milhares de linhas, consumindo orçamento de contexto e fazendo com que a IA ignore metade das regras de qualquer maneira. Um desenvolvedor no r/ClaudeAI construiu um sistema para resolver isso — RunawayContext (licenciado sob MIT, atualmente usado para integrações de gestão de construção na Vista, Procore, Monday.com, etc.).

Arquitetura

A ideia central: mover conhecimento profundo de um arquivo markdown simples para um banco de dados SQLite com busca em texto completo (FTS5) e busca vetorial opcional via sqlite-vec. Em vez de carregar tudo a cada sessão, apenas um pequeno resumo por projeto (~150 linhas), uma constituição global (~200 linhas) e uma "memória viva" baseada em ponteiros (~50 linhas) são carregados antecipadamente. A IA consulta o banco de dados sob demanda usando ferramentas MCP como search_lessons e get_chunk.

Detalhes Chave de Implementação

Matemática de tokens: O equivalente a ~280K tokens ainda existe — eles estão apenas no banco de dados, não carregados no contexto. A IA puxa o que precisa no meio da tarefa.
Limites fixos em código: O regenerador recusa escrever um resumo que ultrapasse seu limite de 150 linhas. 15 regras arquiteturais nomeadas têm testes de CI associados que falham na build se a regra se desviar.
Recuperação híbrida: A busca apenas vetorial foi pior que a híbrida. O sistema combina pontuações de palavras-chave FTS5 com pontuações vetoriais do sqlite-vec para obter melhores resultados.
Humano no loop: A IA escreve novas lições em uma caixa de entrada de rascunhos. Um humano deve aprovar antes da promoção para o repositório de conhecimento, evitando ruído.
Voz preservada: Os resumos gerados automaticamente contêm um bloco curado manualmente, delimitado por marcadores . O regenerador mantém essa seção intacta enquanto regenera tudo ao redor.

Lições Aprendidas

Imponha regras em código, não em política — toda instrução de "cuidado para não crescer" foi violada em poucos meses.
A recuperação híbrida FTS5 + vetorial supera a busca apenas vetorial.
Escritas diretas da IA no repositório de conhecimento introduzem ruído; use uma caixa de entrada de rascunhos com aprovação manual.

O sistema é agnóstico em relação ao agente e o repositório é público para qualquer um adaptar.

📖 Leia a fonte completa: r/ClaudeAI

Gerenciando Contexto de IA com um Armazenamento de Conhecimento SQLite e Ferramentas MCP

Arquitetura

Detalhes Chave de Implementação

Lições Aprendidas

👀 See Also

OpenMontage: Sistema de Produção de Vídeo Agente de Código Aberto para Assistentes de Codificação com IA

tmux-IDE: Um IDE Multiagente Baseado em Terminal para Claude

NERF Plataforma de Engenharia de Segurança de IA de Código Aberto Entra em Beta Público

Desenvolvedor cria biblioteca de compressão em Rust com Claude Opus 4.6, questiona utilidade