RunawayContext: Gestión de contexto IA con SQLite y MCP

Un punto doloroso común con los agentes de codificación de IA: los archivos CLAUDE.md crecen hasta miles de líneas, consumiendo el presupuesto de contexto y haciendo que la IA ignore la mitad de las reglas de todos modos. Un desarrollador en r/ClaudeAI construyó un sistema para resolver esto: RunawayContext (con licencia MIT, actualmente utilizado para integraciones de gestión de construcción en Vista, Procore, Monday.com, etc.).

Arquitectura

La idea central: mover el conocimiento profundo de un archivo markdown plano a una base de datos SQLite con búsqueda de texto completo (FTS5) y búsqueda vectorial opcional mediante sqlite-vec. En lugar de cargar todo en cada sesión, solo se cargan de antemano un breve resumen por proyecto (~150 líneas), una constitución global (~200 líneas) y una "memoria viva" de solo punteros (~50 líneas). La IA consulta la base de datos bajo demanda usando herramientas MCP como search_lessons y get_chunk.

Detalles Clave de Implementación

Matemáticas de tokens: Los ~280K tokens equivalentes siguen existiendo, solo que están en la base de datos, no cargados en el contexto. La IA extrae lo que necesita a mitad de la tarea.
Límites fijos en el código: El regenerador se niega a escribir un resumen que supere su límite de 150 líneas. 15 reglas arquitectónicas nombradas tienen cada una pruebas de CI asociadas que fallan la compilación si la regla se desvía.
Recuperación híbrida: La búsqueda solo vectorial era peor que la híbrida. El sistema combina puntuaciones de palabras clave FTS5 con puntuaciones vectoriales de sqlite-vec para obtener los mejores resultados.
Humano en el bucle: La IA escribe nuevas lecciones en una bandeja de entrada de borradores. Un humano debe aprobar antes de promover al almacén de conocimiento, evitando ruido.
Voz preservada: Los resúmenes generados automáticamente contienen un bloque seleccionado a mano delimitado por marcadores . El regenerador mantiene esa sección intacta mientras regenera todo lo demás.

Lecciones Aprendidas

Aplica las reglas en el código, no en políticas: cada instrucción de "cuidado con no crecer" fue violada en cuestión de meses.
La búsqueda híbrida FTS5 + vectorial supera a la recuperación solo vectorial.
Las escrituras directas de IA en el almacén de conocimiento introducen ruido; usa una bandeja de entrada de borradores con aprobación manual.

El sistema es independiente del agente y el repositorio es público para que cualquiera lo adapte.

📖 Leer la fuente completa: r/ClaudeAI

Gestión del contexto de IA con una tienda de conocimiento SQLite y herramientas MCP

Arquitectura

Detalles Clave de Implementación

Lecciones Aprendidas

👀 Ver también

ClankerRank: Un Punto de Referencia para las Habilidades de Codificación Asistida por IA con Claude Haiku

Mneme: Un gancho de PreToolUse que bloquea las ediciones de Claude Code que violan las decisiones de arquitectura

certctl: Plataforma de gestión de ciclo de vida de certificados autohospedada con 78 endpoints API para automatización de agentes de IA

Reimplementación de código Claude de código abierto parcheada para compatibilidad con modelos locales