Gestión del contexto de IA con una tienda de conocimiento SQLite y herramientas MCP

Un punto doloroso común con los agentes de codificación de IA: los archivos CLAUDE.md crecen hasta miles de líneas, consumiendo el presupuesto de contexto y haciendo que la IA ignore la mitad de las reglas de todos modos. Un desarrollador en r/ClaudeAI construyó un sistema para resolver esto: RunawayContext (con licencia MIT, actualmente utilizado para integraciones de gestión de construcción en Vista, Procore, Monday.com, etc.).
Arquitectura
La idea central: mover el conocimiento profundo de un archivo markdown plano a una base de datos SQLite con búsqueda de texto completo (FTS5) y búsqueda vectorial opcional mediante sqlite-vec. En lugar de cargar todo en cada sesión, solo se cargan de antemano un breve resumen por proyecto (~150 líneas), una constitución global (~200 líneas) y una "memoria viva" de solo punteros (~50 líneas). La IA consulta la base de datos bajo demanda usando herramientas MCP como search_lessons y get_chunk.
Detalles Clave de Implementación
- Matemáticas de tokens: Los ~280K tokens equivalentes siguen existiendo, solo que están en la base de datos, no cargados en el contexto. La IA extrae lo que necesita a mitad de la tarea.
- Límites fijos en el código: El regenerador se niega a escribir un resumen que supere su límite de 150 líneas. 15 reglas arquitectónicas nombradas tienen cada una pruebas de CI asociadas que fallan la compilación si la regla se desvía.
- Recuperación híbrida: La búsqueda solo vectorial era peor que la híbrida. El sistema combina puntuaciones de palabras clave FTS5 con puntuaciones vectoriales de sqlite-vec para obtener los mejores resultados.
- Humano en el bucle: La IA escribe nuevas lecciones en una bandeja de entrada de borradores. Un humano debe aprobar antes de promover al almacén de conocimiento, evitando ruido.
- Voz preservada: Los resúmenes generados automáticamente contienen un bloque seleccionado a mano delimitado por marcadores
<!-- PRESERVE_START -->. El regenerador mantiene esa sección intacta mientras regenera todo lo demás.
Lecciones Aprendidas
- Aplica las reglas en el código, no en políticas: cada instrucción de "cuidado con no crecer" fue violada en cuestión de meses.
- La búsqueda híbrida FTS5 + vectorial supera a la recuperación solo vectorial.
- Las escrituras directas de IA en el almacén de conocimiento introducen ruido; usa una bandeja de entrada de borradores con aprobación manual.
El sistema es independiente del agente y el repositorio es público para que cualquiera lo adapte.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

La extensión Super Claude para navegador hace que la interfaz de usuario de Claude.ai sea completamente personalizable.
Un desarrollador creó una extensión de navegador que permite a los usuarios personalizar cada aspecto de la interfaz de Claude.ai: colores, fuentes, diseño, además de seguimiento de uso y conteo de tokens. La extensión funciona en Chrome y Firefox y fue desarrollada usando el propio Claude.

SIDJUA V1.0: Plataforma de Gobernanza Autohospedada para Agentes de IA
SIDJUA V1.0 es una plataforma de gobernanza autohospedada y gratuita para agentes de IA que se ejecuta en Docker, incluido Raspberry Pi. Proporciona puntos de control obligatorios para tareas de agentes, almacenamiento cifrado de credenciales, aislamiento de red y controles de presupuesto granulares.

VoidLLM: Proxy de Conocimiento Cero para Ollama y vLLM con Control de Acceso por Equipo
VoidLLM es un proxy que se sitúa entre las aplicaciones y los servidores locales de LLM como Ollama y vLLM, añadiendo control de acceso por organización/equipo, gestión de claves API, seguimiento de uso y limitación de tasa sin ver los prompts. Tiene una sobrecarga de proxy de <2ms y funciona con SDKs compatibles con OpenAI.

El benchmark muestra que el motor de contexto reduce los costos del agente de codificación de IA en 3 veces en SWE-bench.
Una evaluación comparativa de 4 agentes de codificación utilizando Claude Opus 4.5 en SWE-bench Verified muestra que un motor de contexto logró una tasa de aprobación del 73% a $0.67/tarea, mientras que otros agentes costaron hasta $1.98/tarea para un rendimiento similar o inferior.