Ahorra en las facturas de Claude Code al enrutar los tokens de planificación a modelos más baratos

Un usuario de Reddit informa haber ahorrado alrededor de $40 en tarifas por exceso en Claude Code el mes pasado al dividir el uso de tokens entre modelos. La idea clave: los pasos de planificación (especialmente en refactorizaciones de múltiples archivos) pueden consumir hasta el 80% del presupuesto de tokens, pero la mayor parte de la planificación no necesita el modelo más caro.
Cómo funciona
Escribieron un envoltorio de 30 líneas que dirige el trabajo inicial de 'descubrir qué cambiar' a Haiku 3.5, un modelo más barato. Solo las ediciones reales y la toma de decisiones permanecen en Opus o Sonnet. La configuración tomó aproximadamente 2 horas, incluido determinar qué pasos valía la pena delegar.
Resultados
El último ciclo terminó con presupuesto sobrante por primera vez en 4 meses. El usuario evitó la espera habitual de 2 días para la ventana de reinicio. Ahorro: aproximadamente $40 en tarifas por exceso.
# Pseudocódigo de la lógica del envoltorio:
# 1. Enviar el prompt de planificación a haiku-3.5
# 2. Obtener una lista de archivos y cambios
# 3. Pasar el plan + la instrucción a opus/sonnet para las ediciones reales
Advertencias
La calidad de planificación de Haiku es notablemente peor en decisiones de arquitectura. Para flujos de trabajo de refactorización y prueba donde Opus toma las decisiones reales de todos modos, está bien. Para diseño desde cero ('qué debería ser esta aplicación'), el usuario aún deja que Opus planifique desde cero.
El usuario señala que este patrón es 'probablemente obvio para cualquiera que haya mirado las tablas de precios de modelos de OpenRouter', pero la documentación del subagente de Claude Code es escasa sobre este enfoque exacto.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

Uso de Herramientas de Dictado para Instrucciones Más Efectivas en Agentes de IA
Un desarrollador descubrió que cambiar de instrucciones escritas a habladas para OpenClaw mejoró la calidad de los resultados al proporcionar un contexto más natural y detallado, utilizando SaySo.ai como herramienta de dictado.

Usando un mensaje estilo GAN para mejorar el pensamiento crítico de Claude.
Un usuario de Reddit comparte una frase específica para que Claude adopte un marco de pensamiento estilo GAN, obligándolo a criticar y poner a prueba ideas en lugar de ofrecer respuestas superficiales y complacientes.

Corrección del proxy de Discord OpenClaw para problemas de tiempo de espera de la API REST
Un usuario reporta haber solucionado problemas de conexión de OpenClaw Discord donde WebSocket se conecta pero las llamadas a la API REST fallan con errores "fetch failed UND_ERR_CONNECT_TIMEOUT". La solución implica crear un archivo proxy-preload.cjs y configurar los ajustes globales del proxy undici.

Enmarcar Conversaciones de IA en Lugar de Escribir Prompts Perfectos
Un desarrollador en r/ClaudeAI describe cómo pasó de obsesionarse con redactar prompts perfectos a enmarcar las conversaciones con Claude AI como situaciones, lo que resultó en salidas significativamente mejores.