ClawCodex /modo asesor: Combine trabajador barato con revisor caro para reducir costos sin perder calidad

✍️ OpenClawRadar📅 Publicado: 27 de mayo de 2026🔗 Source
ClawCodex /modo asesor: Combine trabajador barato con revisor caro para reducir costos sin perder calidad
Ad

La mayoría de los CLI de agentes te obligan a elegir un solo modelo: Opus ofrece excelentes decisiones pero agota tu presupuesto, mientras que Haiku es barato pero omite decisiones arquitectónicas críticas. ClawCodex, una versión Python de código abierto de Claude Code, resuelve esto con un modo /advisor que combina un modelo de trabajo barato con un modelo de revisión costoso en puntos clave de decisión.

Cómo funciona

El trabajador barato (por ejemplo, haiku-4-5, deepseek-v4-pro) realiza el trabajo pesado (lectura de archivos, ediciones, ejecución de pruebas). En los puntos de decisión (antes de comprometerse con una interpretación, antes de declarar una tarea completada o cuando se atasca), el trabajador se detiene y consulta a un revisor más potente (por ejemplo, opus-4-7). El revisor ve toda la conversación (cada llamada a herramienta, cada resultado) y devuelve un breve fragmento de consejo con Brechas / Riesgos / Próximo paso. Luego, el trabajador continúa.

Dos modos de ejecución

  • Lado del servidor (Anthropic 1P): Utiliza un encabezado beta de asesor: un solo viaje de ida y vuelta, compatible con caché de indicaciones. Tanto el trabajador como el asesor se ejecutan en Anthropic.
  • Lado del cliente (cualquier proveedor): El trabajador emite un tool_use normal, el agente lo intercepta y realiza una llamada separada al modelo asesor configurado. Dos viajes de ida y vuelta, pero puedes mezclar proveedores, por ejemplo, DeepSeek como trabajador + Claude Opus como asesor, o Gemini como trabajador + GLM como asesor.
Ad

Configuración y monitoreo

La configuración es una sola línea en el REPL:

/advisor anthropic:claude-opus-4-7
/advisor deepseek:deepseek-v4-pro

La barra de estado muestra tokens del trabajador, tokens del asesor y costo en USD por separado, para que puedas ver exactamente en qué se gasta tu presupuesto.

Benchmarks y compatibilidad

ClawCodex es compatible de forma nativa con Anthropic, OpenAI, Gemini, DeepSeek, GLM, Minimax y OpenRouter. En SWE-bench Verified, el agente obtiene un 58.2% con Gemini 2.5 Pro, frente al 53% de OpenClaude bajo el mismo entorno de prueba.

La parte difícil: las indicaciones

El desafío de ingeniería más complicado fue evitar que el asesor simplemente repitiera el plan del trabajador; las primeras versiones desperdiciaban contexto con repeticiones literales. La solución fue una estricta regla de “sin voz en primera persona, sin repeticiones”, combinada con la plantilla Brechas / Riesgos / Próximo paso.

Para quién es

Desarrolladores que usan agentes de codificación de IA y desean un criterio arquitectónico de nivel Opus sin pagar las tarifas de Opus en cada llamada.

📖 Lea la fuente completa: r/openclaw

Ad

👀 Ver también

Sx: Un gestor de paquetes de código abierto para habilidades de IA, MCPs y comandos
Herramientas

Sx: Un gestor de paquetes de código abierto para habilidades de IA, MCPs y comandos

Sx es un gestor de paquetes privado tipo npm para activos de IA—habilidades, configuraciones MCP, comandos, hooks y agentes—que permite a los equipos compartir, versionar y delimitar configuraciones de IA en cualquier cliente de IA (Claude Code, Cursor, Copilot, Gemini).

OpenClawRadar
Herramienta de Navegador de Código Abierto para Probar Servidores MCP Sin Instalación
Herramientas

Herramienta de Navegador de Código Abierto para Probar Servidores MCP Sin Instalación

Una herramienta web de código abierto llamada MCP Playground permite a los desarrolladores probar servidores MCP directamente en su navegador usando WebContainers, un entorno de ejecución Node.js basado en WASM. Puede ejecutar servidores MCP basados en npm localmente sin instalación de backend y conectarse a servidores remotos mediante URL.

OpenClawRadar
hipEngine: Inferencia Rápida Nativa de Qwen 3.6 para RDNA3 (Strix Halo, 7900 XTX)
Herramientas

hipEngine: Inferencia Rápida Nativa de Qwen 3.6 para RDNA3 (Strix Halo, 7900 XTX)

hipEngine es un nuevo motor de inferencia de código abierto (AGPLv3) nativo de ROCm para Qwen 3.6 MoE en GPUs RDNA3. Los benchmarks muestran prefill de hasta 2718 tok/s en 7900 XTX, competitivo con llama.cpp, y caché KV INT8 que permite contexto completo de 256K en menos de 24 GB.

OpenClawRadar
MoltNow.app: Plataforma de despliegue de OpenClaw en un clic
Herramientas

MoltNow.app: Plataforma de despliegue de OpenClaw en un clic

Un nuevo servicio promete simplificar el despliegue de OpenClaw a un solo clic con UI personalizada y automatización del navegador.

MoltNow.app builder