ClawCodex Modo /advisor: Reduce Costos de Agentes sin Perder Calidad

La mayoría de los CLI de agentes te obligan a elegir un solo modelo: Opus ofrece excelentes decisiones pero agota tu presupuesto, mientras que Haiku es barato pero omite decisiones arquitectónicas críticas. ClawCodex, una versión Python de código abierto de Claude Code, resuelve esto con un modo /advisor que combina un modelo de trabajo barato con un modelo de revisión costoso en puntos clave de decisión.

Cómo funciona

El trabajador barato (por ejemplo, haiku-4-5, deepseek-v4-pro) realiza el trabajo pesado (lectura de archivos, ediciones, ejecución de pruebas). En los puntos de decisión (antes de comprometerse con una interpretación, antes de declarar una tarea completada o cuando se atasca), el trabajador se detiene y consulta a un revisor más potente (por ejemplo, opus-4-7). El revisor ve toda la conversación (cada llamada a herramienta, cada resultado) y devuelve un breve fragmento de consejo con Brechas / Riesgos / Próximo paso. Luego, el trabajador continúa.

Dos modos de ejecución

Lado del servidor (Anthropic 1P): Utiliza un encabezado beta de asesor: un solo viaje de ida y vuelta, compatible con caché de indicaciones. Tanto el trabajador como el asesor se ejecutan en Anthropic.
Lado del cliente (cualquier proveedor): El trabajador emite un tool_use normal, el agente lo intercepta y realiza una llamada separada al modelo asesor configurado. Dos viajes de ida y vuelta, pero puedes mezclar proveedores, por ejemplo, DeepSeek como trabajador + Claude Opus como asesor, o Gemini como trabajador + GLM como asesor.

Configuración y monitoreo

La configuración es una sola línea en el REPL:

/advisor anthropic:claude-opus-4-7
/advisor deepseek:deepseek-v4-pro

La barra de estado muestra tokens del trabajador, tokens del asesor y costo en USD por separado, para que puedas ver exactamente en qué se gasta tu presupuesto.

Benchmarks y compatibilidad

ClawCodex es compatible de forma nativa con Anthropic, OpenAI, Gemini, DeepSeek, GLM, Minimax y OpenRouter. En SWE-bench Verified, el agente obtiene un 58.2% con Gemini 2.5 Pro, frente al 53% de OpenClaude bajo el mismo entorno de prueba.

La parte difícil: las indicaciones

El desafío de ingeniería más complicado fue evitar que el asesor simplemente repitiera el plan del trabajador; las primeras versiones desperdiciaban contexto con repeticiones literales. La solución fue una estricta regla de “sin voz en primera persona, sin repeticiones”, combinada con la plantilla Brechas / Riesgos / Próximo paso.

Para quién es

Desarrolladores que usan agentes de codificación de IA y desean un criterio arquitectónico de nivel Opus sin pagar las tarifas de Opus en cada llamada.

📖 Lea la fuente completa: r/openclaw

ClawCodex /modo asesor: Combine trabajador barato con revisor caro para reducir costos sin perder calidad

Cómo funciona

Dos modos de ejecución

Configuración y monitoreo

Benchmarks y compatibilidad

La parte difícil: las indicaciones

Para quién es

👀 Ver también

El Marco de Agentes Jork Desarrollado con Claude se Clasifica entre los 10 Mejores en un Hackatón de $4 Millones

Plataforma ELBO: Capacitación con IA para el Pensamiento Crítico y las Habilidades de Comunicación

La Aplicación de Escritorio de Claude con la Función de Colaboración Permite la Comunicación de IA a IA a través de Documentos Compartidos de Google

Microsoft Teams SDK Agrega Adaptador de Servidor HTTP para Agentes de IA Existentes