Apideck CLI: Una alternativa de bajo contexto a MCP para agentes de IA

El Problema de la Ventana de Contexto de MCP
El artículo describe un escenario específico: conectar GitHub, Slack y Sentry a través de servidores MCP (aproximadamente 40 herramientas en total) consume más de 55,000 tokens antes de que el agente procese un solo mensaje del usuario. Eso es más de un cuarto del límite de 200k de Claude. Cada definición de herramienta MCP cuesta entre 550 y 1,400 tokens por su nombre, descripción, esquema JSON, descripciones de campos, enumeraciones e instrucciones del sistema.
Un equipo reportó que tres servidores MCP consumían 143,000 de 200,000 tokens (72% de la ventana de contexto), dejando solo 57,000 tokens para la conversación real, documentos recuperados, razonamiento y respuesta.
David Zhang (@dzhng), al construir Duet, describió la eliminación completa de las integraciones MCP debido a un "trilema": cargar todo desde el principio y perder memoria de trabajo, limitar las integraciones para que el agente solo pueda comunicarse con unos pocos servicios, o construir una carga dinámica de herramientas que añade latencia y complejidad de middleware.
Resultados de los Benchmarks
Un benchmark realizado por Scalekit ejecutó 75 comparaciones cara a cara (mismo modelo: Claude Sonnet 4, mismas tareas, mismos prompts) y encontró:
- MCP cuesta de 4 a 32 veces más tokens que CLI para operaciones idénticas
- Verificar el lenguaje de un repositorio consumió 1,365 tokens vía CLI frente a 44,026 vía MCP
- La sobrecarga es casi en su totalidad de esquemas: 43 definiciones de herramientas inyectadas en cada conversación, de las cuales el agente usa una o dos
Enfoque de Apideck CLI
El Apideck CLI utiliza un prompt de agente de aproximadamente 80 tokens que reemplaza decenas de miles de tokens de esquema. Cuenta con divulgación progresiva a través de --help y seguridad estructural integrada en el binario. Cualquier agente que pueda ejecutar comandos de shell puede usarlo sin requerir soporte de protocolo.
Respuestas de la Industria a la Inflación de Contexto
El artículo identifica tres enfoques de la industria:
- MCP con trucos de compresión: Comprimir esquemas, usar búsqueda de herramientas para cargar definiciones bajo demanda, o construir middleware que divida las especificaciones OpenAPI en fragmentos más pequeños. Esto funciona para interacciones pequeñas y bien definidas, pero añade necesidades de infraestructura (registro de herramientas, lógica de búsqueda, almacenamiento en caché, enrutamiento).
- Interfaces CLI-first: El enfoque adoptado por Apideck CLI.
- Protocolos nativos de agentes: Mencionados pero no detallados en el texto fuente proporcionado.
📖 Leer la fuente completa: HN AI Agents
👀 Ver también

devopsiphai: Habilidad de código Claude de código abierto audita la salud operativa en 6 fases
devopsiphai es una habilidad de código abierto de Claude Code que audita la operabilidad de proyectos de producción utilizando un proceso de 6 fases y el marco ARC, generando calificaciones con letras y un TODO.md estructurado con tareas estimadas por esfuerzo.

Architect CLI: Herramienta de código abierto para orquestar agentes de IA sin interfaz en CI/CD
Architect es una herramienta CLI de código abierto diseñada para agentes de codificación autónomos en pipelines CI/CD, que incluye el Bucle Ralph para ciclos de prueba y reintento, barreras de protección deterministas, definiciones de pipelines en YAML y soporte para múltiples LLMs a través de LiteLLM.

VectorClaw v1.0.0: Servidor MCP para el Control del Robot Anki Vector
VectorClaw v1.0.0 es un servidor MCP que permite a OpenClaw controlar robots Anki Vector a través de 23 herramientas específicas para funciones de voz, movimiento, percepción, sensores y pantalla.

El Marco SIDJUA Agrega una Capa de Gobernanza a los Agentes Autónomos de IA
SIDJUA es un marco de trabajo con gobernanza integrada, reglas de autoridad basadas en roles y seguimiento de auditoría completo que se sitúa sobre cualquier modelo de IA con una API. La demostración muestra una jerarquía de tres niveles que escala a 7+1 niveles, con cada decisión registrada y los costos rastreados en tiempo real.