Gestión del contexto de IA con una tienda de conocimiento SQLite y herramientas MCP

✍️ OpenClawRadar📅 Publicado: 14 de mayo de 2026🔗 Source
Gestión del contexto de IA con una tienda de conocimiento SQLite y herramientas MCP
Ad

Un punto doloroso común con los agentes de codificación de IA: los archivos CLAUDE.md crecen hasta miles de líneas, consumiendo el presupuesto de contexto y haciendo que la IA ignore la mitad de las reglas de todos modos. Un desarrollador en r/ClaudeAI construyó un sistema para resolver esto: RunawayContext (con licencia MIT, actualmente utilizado para integraciones de gestión de construcción en Vista, Procore, Monday.com, etc.).

Arquitectura

La idea central: mover el conocimiento profundo de un archivo markdown plano a una base de datos SQLite con búsqueda de texto completo (FTS5) y búsqueda vectorial opcional mediante sqlite-vec. En lugar de cargar todo en cada sesión, solo se cargan de antemano un breve resumen por proyecto (~150 líneas), una constitución global (~200 líneas) y una "memoria viva" de solo punteros (~50 líneas). La IA consulta la base de datos bajo demanda usando herramientas MCP como search_lessons y get_chunk.

Ad

Detalles Clave de Implementación

  • Matemáticas de tokens: Los ~280K tokens equivalentes siguen existiendo, solo que están en la base de datos, no cargados en el contexto. La IA extrae lo que necesita a mitad de la tarea.
  • Límites fijos en el código: El regenerador se niega a escribir un resumen que supere su límite de 150 líneas. 15 reglas arquitectónicas nombradas tienen cada una pruebas de CI asociadas que fallan la compilación si la regla se desvía.
  • Recuperación híbrida: La búsqueda solo vectorial era peor que la híbrida. El sistema combina puntuaciones de palabras clave FTS5 con puntuaciones vectoriales de sqlite-vec para obtener los mejores resultados.
  • Humano en el bucle: La IA escribe nuevas lecciones en una bandeja de entrada de borradores. Un humano debe aprobar antes de promover al almacén de conocimiento, evitando ruido.
  • Voz preservada: Los resúmenes generados automáticamente contienen un bloque seleccionado a mano delimitado por marcadores <!-- PRESERVE_START -->. El regenerador mantiene esa sección intacta mientras regenera todo lo demás.

Lecciones Aprendidas

  • Aplica las reglas en el código, no en políticas: cada instrucción de "cuidado con no crecer" fue violada en cuestión de meses.
  • La búsqueda híbrida FTS5 + vectorial supera a la recuperación solo vectorial.
  • Las escrituras directas de IA en el almacén de conocimiento introducen ruido; usa una bandeja de entrada de borradores con aprobación manual.

El sistema es independiente del agente y el repositorio es público para que cualquiera lo adapte.

📖 Leer la fuente completa: r/ClaudeAI

Ad

👀 Ver también

La extensión Super Claude para navegador hace que la interfaz de usuario de Claude.ai sea completamente personalizable.
Herramientas

La extensión Super Claude para navegador hace que la interfaz de usuario de Claude.ai sea completamente personalizable.

Un desarrollador creó una extensión de navegador que permite a los usuarios personalizar cada aspecto de la interfaz de Claude.ai: colores, fuentes, diseño, además de seguimiento de uso y conteo de tokens. La extensión funciona en Chrome y Firefox y fue desarrollada usando el propio Claude.

OpenClawRadar
SIDJUA V1.0: Plataforma de Gobernanza Autohospedada para Agentes de IA
Herramientas

SIDJUA V1.0: Plataforma de Gobernanza Autohospedada para Agentes de IA

SIDJUA V1.0 es una plataforma de gobernanza autohospedada y gratuita para agentes de IA que se ejecuta en Docker, incluido Raspberry Pi. Proporciona puntos de control obligatorios para tareas de agentes, almacenamiento cifrado de credenciales, aislamiento de red y controles de presupuesto granulares.

OpenClawRadar
VoidLLM: Proxy de Conocimiento Cero para Ollama y vLLM con Control de Acceso por Equipo
Herramientas

VoidLLM: Proxy de Conocimiento Cero para Ollama y vLLM con Control de Acceso por Equipo

VoidLLM es un proxy que se sitúa entre las aplicaciones y los servidores locales de LLM como Ollama y vLLM, añadiendo control de acceso por organización/equipo, gestión de claves API, seguimiento de uso y limitación de tasa sin ver los prompts. Tiene una sobrecarga de proxy de <2ms y funciona con SDKs compatibles con OpenAI.

OpenClawRadar
El benchmark muestra que el motor de contexto reduce los costos del agente de codificación de IA en 3 veces en SWE-bench.
Herramientas

El benchmark muestra que el motor de contexto reduce los costos del agente de codificación de IA en 3 veces en SWE-bench.

Una evaluación comparativa de 4 agentes de codificación utilizando Claude Opus 4.5 en SWE-bench Verified muestra que un motor de contexto logró una tasa de aprobación del 73% a $0.67/tarea, mientras que otros agentes costaron hasta $1.98/tarea para un rendimiento similar o inferior.

OpenClawRadar