Enrutamiento de subtareas del agente a modelos más baratos redujo el costo de $18 a $4 en la misma refactorización

Un desarrollador en r/ClaudeAI describe una estrategia práctica de optimización de costos para bucles de agentes: enrutar subtareas rutinarias a modelos baratos y reservar modelos costosos (Opus 4.7) solo para razonamiento complejo. Su agente de refactorización —que maneja cambios de nombres de variables CSS, actualizaciones de configuración YAML y ejecuciones de linter a través de MCP— originalmente enviaba cada paso a Opus 4.7 con un costo total de aproximadamente $18. Después de implementar la lógica de enrutamiento, 178 de 212 pasos fueron a modelos baratos, reduciendo el costo a aproximadamente $4 sin diferencias de calidad observables en cambios rutinarios.
Lógica de enrutamiento
- Subtareas complejas → Opus 4.7: Arquitectura de componentes, depuración de código de madrugada, cualquier cosa que requiera razonamiento sostenido en conversaciones largas. El autor señala que Opus es genuinamente insuperable en ese tipo de trabajo; un intento previo de enrutar un fallo de middleware de autenticación a un modelo más barato rompió silenciosamente el manejo de sesiones, costando una hora de rastreo.
- Subtareas rutinarias → modelos más baratos: Lint, renombrar, ediciones de configuración, orquestación de herramientas. El autor optó por DeepSeek V4 Pro para tareas de codificación general y Tencent Hunyuan Hy3 vista previa para llamadas intensivas a herramientas. A finales de abril, Hunyuan Hy3 ocupaba el puesto #1 en OpenRouter por volumen de llamadas a herramientas y casi nunca falla una llamada a función cuando el esquema es limpio.
Comparación de costos
- Opus 4.7: ~$0.18 por millón de tokens de entrada (estimado del contexto de ~28 veces más barato).
- Tencent Hunyuan Hy3: $0.18 por millón de tokens de entrada, $0.59 por millón de salida — aproximadamente 28 veces más barato que Opus 4.7 en entrada.
- Misma refactorización de 212 pasos: 178 pasos al nivel barato, 34 pasos a Opus. El costo bajó de $18 a ~$4.
Modos de fallo
- El modelo de llamada a herramientas alucina parámetros cuando los esquemas son descuidados (el autor admite que los esquemas eran malos).
- DeepSeek V4 Pro ocasionalmente escribe código sintácticamente perfecto que hace lo contrario de lo solicitado, sobreviviendo a un vistazo rápido.
- Ningún modelo barato puede igualar a Opus para depurar problemas profundos (por ejemplo, un flujo de autenticación que se come silenciosamente una cookie).
Heurística de decisión
La regla general de enrutamiento del autor: "¿Qué tan costoso es detectar una respuesta incorrecta?" Una mala corrección de lint cuesta un revert de git de 2 segundos; una mala decisión de arquitectura cuesta toda la tarde.
Los ahorros permitieron tareas previamente omitidas —como escribir y ejecutar pruebas para cada cambio de CSS, o regenerar todas las imágenes de Open Graph— porque a fracciones de centavo por llamada a herramienta no hay razón para no hacerlo.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

Cómo se inyectan las instrucciones del Proyecto Claude — Y por qué cambiarlas a mitad de conversación rompe el historial
Las Instrucciones del Proyecto y las Preferencias del Usuario se cargan en el prompt del sistema al inicio de la conversación, no se reinyectan en cada turno. Cambiarlas a mitad de la conversación hace que Claude sobrescriba su memoria de las instrucciones anteriores, lo que genera recuerdos falsos.

Consejos de instalación de OpenClaw: Omitir el proceso de incorporación y usar comandos de diagnóstico
Un usuario de Reddit comparte consejos prácticos para la instalación de OpenClaw: omite el proceso de incorporación para evitar problemas comunes, especialmente en configuraciones VPS, y utiliza los comandos openclaw doctor y openclaw status para diagnosticar problemas de configuración.

El enrutamiento reduce el costo máximo de uso de OpenClaw en un 85%: de $200/mes a $30/mes con enrutamiento API
Un usuario rastreó el uso de tokens y descubrió que solo el 15% de las tareas necesitan Opus. Al enrutar el trabajo rutinario a Sonnet a través de la API, el costo mensual se redujo de $200 a $30 con una calidad de salida idéntica.

Perspectivas Prácticas del Uso de OpenClaw Basadas en la Experiencia Directa
Un usuario de Reddit comparte siete lecciones específicas del uso de OpenClaw, que abordan los desafíos de configuración, despliegue de máquinas virtuales, integración de Skills frente a MCP, organización del contexto, seguridad de credenciales, múltiples agentes y estrategias de selección de modelos.