Cómo ahorrar en Claude Code: Enruta tokens de planificación a Haiku 3.5

Un usuario de Reddit informa haber ahorrado alrededor de $40 en tarifas por exceso en Claude Code el mes pasado al dividir el uso de tokens entre modelos. La idea clave: los pasos de planificación (especialmente en refactorizaciones de múltiples archivos) pueden consumir hasta el 80% del presupuesto de tokens, pero la mayor parte de la planificación no necesita el modelo más caro.

Cómo funciona

Escribieron un envoltorio de 30 líneas que dirige el trabajo inicial de 'descubrir qué cambiar' a Haiku 3.5, un modelo más barato. Solo las ediciones reales y la toma de decisiones permanecen en Opus o Sonnet. La configuración tomó aproximadamente 2 horas, incluido determinar qué pasos valía la pena delegar.

Resultados

El último ciclo terminó con presupuesto sobrante por primera vez en 4 meses. El usuario evitó la espera habitual de 2 días para la ventana de reinicio. Ahorro: aproximadamente $40 en tarifas por exceso.

# Pseudocódigo de la lógica del envoltorio:
# 1. Enviar el prompt de planificación a haiku-3.5
# 2. Obtener una lista de archivos y cambios
# 3. Pasar el plan + la instrucción a opus/sonnet para las ediciones reales

Advertencias

La calidad de planificación de Haiku es notablemente peor en decisiones de arquitectura. Para flujos de trabajo de refactorización y prueba donde Opus toma las decisiones reales de todos modos, está bien. Para diseño desde cero ('qué debería ser esta aplicación'), el usuario aún deja que Opus planifique desde cero.

El usuario señala que este patrón es 'probablemente obvio para cualquiera que haya mirado las tablas de precios de modelos de OpenRouter', pero la documentación del subagente de Claude Code es escasa sobre este enfoque exacto.

📖 Leer la fuente completa: r/ClaudeAI

Ahorra en las facturas de Claude Code al enrutar los tokens de planificación a modelos más baratos

Cómo funciona

Resultados

Advertencias

👀 Ver también

Escribir archivos SOUL.md efectivos para agentes de programación de IA

Usuario de Claude Comparte el Prompt 'No Gestiones Mis Sentimientos' para Retroalimentación Técnica Directa

Usando ntfy para notificaciones del agente OpenClaw

La comunidad discute soluciones para el consumo de tokens en OpenClaw