Context Gateway: Un Proxy de Código Abierto para Comprimir el Contexto de Agentes de IA

Qué hace Context Gateway
Context Gateway es un proxy agéntico que se sitúa entre los agentes de programación de IA (como Claude Code, OpenClaw o Cursor) y la API del LLM. Cuando las salidas de herramientas como lecturas de archivos o resultados de grep vierten miles de tokens en la ventana de contexto, el proxy comprime este contenido antes de que llegue al LLM. La motivación proviene de investigaciones que muestran que los puntos de referencia de contexto largo experimentan caídas pronunciadas en la precisión a medida que crece el contexto: la evaluación GPT-5.4 de OpenAI supuestamente cae del 97,2% con 32k tokens al 36,6% con 1M tokens.
Cómo funciona la compresión
El sistema utiliza modelos de lenguaje pequeños (SLM) que examinan los internos del modelo y entrenan clasificadores para detectar qué partes del contexto contienen la mayor señal. Cuando una herramienta devuelve una salida, la compresión ocurre condicionada por la intención de la llamada a la herramienta. Por ejemplo, si un agente llamó a grep buscando patrones de manejo de errores, el SLM mantiene las coincidencias relevantes y elimina el resto. Si el modelo necesita más tarde algo que fue eliminado, puede llamar a expand() para recuperar la salida original.
Características clave y configuración
- Compactación en segundo plano: Se activa al 85% de la capacidad de la ventana, con resúmenes precalculados para que no esperes la compactación
- Descripciones de herramientas de carga diferida: El modelo solo ve las herramientas relevantes para el paso actual
- Límites de gasto: Controla los costos con límites presupuestarios
- Panel de control: Haz seguimiento de sesiones actuales y pasadas
- Notificaciones de Slack: Recibe alertas cuando un agente está esperando por ti
- Agentes compatibles: Claude Code, Cursor, OpenClaw o configuraciones personalizadas
Comenzar
Instala con:
curl -fsSL https://compresr.ai/api/install | sh
Luego ejecuta context-gateway para iniciar un asistente TUI interactivo que te ayuda a:
- Elegir un agente (claude_code, cursor, openclaw o personalizado)
- Crear/editar configuración incluyendo modelo de resumen y clave API
- Habilitar notificaciones de Slack si es necesario
- Establecer umbral de activación para compresión (predeterminado: 75%)
La herramienta es de código abierto, construida principalmente en Go (90,9%) y mantenida por Compresr, una empresa respaldada por YC. Puedes revisar los registros de compactación en logs/history_compaction.jsonl para ver qué está sucediendo internamente.
📖 Leer la fuente completa: HN LLM Tools
👀 Ver también

Intuno: Red de Código Abierto para el Descubrimiento y Comunicación de Agentes de IA
Intuno es una red de código abierto donde los agentes de IA registran capacidades, se descubren entre sí mediante búsqueda semántica e invocan funciones con 3 líneas de código Python. Incluye integración MCP para usar con Claude Desktop o Cursor.

Traducción de IA para software de contabilidad forense con mi padre — CaseTrail automatiza la detección de fraudes financieros
Un equipo de padre e hijo creó CaseTrail, una herramienta de contabilidad forense impulsada por IA que ingiere extractos bancarios e identifica anomalías. El blog detalla la integración con LLMs para el análisis de transacciones.

nervx: Herramienta CLI reduce el uso de tokens de Claude Code analizando la estructura del código base
nervx es una herramienta CLI instalable mediante pip que analiza repositorios con tree-sitter, construye un grafo SQLite de funciones e importaciones, y genera un mapa estructural NERVX.md. Automáticamente agrega instrucciones a CLAUDE.md que enseñan a Claude a usar la navegación de nervx, reduciendo las búsquedas grep en un 65% y los tokens de salida en un 48% en las pruebas.

Claude Cowork vs OpenClaw: Dónde se sostiene y se rompe la narrativa de reemplazo
Claude Cowork ofrece sesiones de escritorio persistentes con baja fricción, mientras que OpenClaw mantiene ventajas en automatización a nivel de sistema, ecosistemas de habilidades y control de flujos de trabajo.