Context Gateway: Proxy Open Source para Comprimir Contexto de Agentes de IA

Qué hace Context Gateway

Context Gateway es un proxy agéntico que se sitúa entre los agentes de programación de IA (como Claude Code, OpenClaw o Cursor) y la API del LLM. Cuando las salidas de herramientas como lecturas de archivos o resultados de grep vierten miles de tokens en la ventana de contexto, el proxy comprime este contenido antes de que llegue al LLM. La motivación proviene de investigaciones que muestran que los puntos de referencia de contexto largo experimentan caídas pronunciadas en la precisión a medida que crece el contexto: la evaluación GPT-5.4 de OpenAI supuestamente cae del 97,2% con 32k tokens al 36,6% con 1M tokens.

Cómo funciona la compresión

El sistema utiliza modelos de lenguaje pequeños (SLM) que examinan los internos del modelo y entrenan clasificadores para detectar qué partes del contexto contienen la mayor señal. Cuando una herramienta devuelve una salida, la compresión ocurre condicionada por la intención de la llamada a la herramienta. Por ejemplo, si un agente llamó a grep buscando patrones de manejo de errores, el SLM mantiene las coincidencias relevantes y elimina el resto. Si el modelo necesita más tarde algo que fue eliminado, puede llamar a expand() para recuperar la salida original.

Características clave y configuración

Compactación en segundo plano: Se activa al 85% de la capacidad de la ventana, con resúmenes precalculados para que no esperes la compactación
Descripciones de herramientas de carga diferida: El modelo solo ve las herramientas relevantes para el paso actual
Límites de gasto: Controla los costos con límites presupuestarios
Panel de control: Haz seguimiento de sesiones actuales y pasadas
Notificaciones de Slack: Recibe alertas cuando un agente está esperando por ti
Agentes compatibles: Claude Code, Cursor, OpenClaw o configuraciones personalizadas

Comenzar

Instala con:

curl -fsSL https://compresr.ai/api/install | sh

Luego ejecuta context-gateway para iniciar un asistente TUI interactivo que te ayuda a:

Elegir un agente (claude_code, cursor, openclaw o personalizado)
Crear/editar configuración incluyendo modelo de resumen y clave API
Habilitar notificaciones de Slack si es necesario
Establecer umbral de activación para compresión (predeterminado: 75%)

La herramienta es de código abierto, construida principalmente en Go (90,9%) y mantenida por Compresr, una empresa respaldada por YC. Puedes revisar los registros de compactación en logs/history_compaction.jsonl para ver qué está sucediendo internamente.

📖 Leer la fuente completa: HN LLM Tools

Context Gateway: Un Proxy de Código Abierto para Comprimir el Contexto de Agentes de IA

Qué hace Context Gateway

Cómo funciona la compresión

Características clave y configuración

Comenzar

👀 Ver también

Intuno: Red de Código Abierto para el Descubrimiento y Comunicación de Agentes de IA

Traducción de IA para software de contabilidad forense con mi padre — CaseTrail automatiza la detección de fraudes financieros

nervx: Herramienta CLI reduce el uso de tokens de Claude Code analizando la estructura del código base

Claude Cowork vs OpenClaw: Dónde se sostiene y se rompe la narrativa de reemplazo