Cómo un comando /loop quemó $6,000 en la API de Claude durante la noche

Un usuario de Reddit informó que se despertó y encontró su límite de uso de Claude agotado después de que un solo comando /loop 30m check my PRs se ejecutara 46 veces durante 26 horas sin supervisión en claude-opus-4-7, quemando aproximadamente $6,000. La causa raíz: el comportamiento del caché de prompt combinado con una sesión de larga duración.
Aquí está el desglose técnico:
- La ventana de contexto crece en cada iteración: Cada llamada API envía todo el historial de la conversación. La ronda 1 puede ser unos cientos de tokens; la ronda 46 envía 800K tokens. Pagas por todo lo enviado en cada ronda.
- El caché de prompt caduca después de ~5 minutos: Anthropic almacena en caché el historial de la conversación con un descuento de 12.5× si se reutiliza dentro de la ventana de caché. Pero con
/loop 30m, el intervalo de 30 minutos supera el TTL de caché de 5 minutos. Cada iteración paga la costosa tarifa de escritura para volver a almacenar en caché todo el contexto creciente desde cero. - La salida se agrega al contexto: Cada iteración del bucle añade su salida a la conversación, haciendo que el próximo re-caché sea aún más grande. En la hora 20, la sesión alcanzó ~800K tokens.
- El retraso del tablero oculta el daño: El tablero de uso de Anthropic tiene un retraso de reporte de varios días. La única señal en tiempo real fue el correo de notificación de límite; para entonces el dinero ya se había gastado.
Las recomendaciones clave del usuario para evitar esto:
- Añade una condición de parada: En lugar de
/loop 30m check my PRsdesnudo, escribe/loop 30m check my PRs — stop when all are merged or after 3 hours. Claude termina el bucle cuando se cumple la condición. - Usa Sonnet para tareas no supervisadas: Opus es ~5× más caro por token de salida. Para tareas de sondeo como revisiones de PR, Sonnet es suficiente. Reserva Opus para sesiones donde estés presente.
- No confíes en el tablero: Tiene un retraso de días. Confía en los correos de límite de uso para señales de facturación en tiempo real.
- Las sesiones nuevas son más baratas: Las sesiones de larga duración acumulan costos porque cada llamada con un intervalo >5 minutos paga por volver a almacenar en caché el contexto completo. Iniciar una nueva sesión restablece el contexto y evita esto.
max_turnsno es un limitador de bucle: Limita las cadenas de llamadas a herramientas dentro de una sola iteración, no cuántas veces se dispara el bucle. La única caducidad incorporada en/loopes una eliminación automática a los 7 días.
El bucle se ejecuta en la conversación principal, así que si mantienes la misma sesión activa, cada ejecución del bucle lee y escribe muchos más tokens de los necesarios, amplificando los costos exponencialmente.
Si automatizas Claude con /loop, siempre establece una condición de parada, usa un modelo más barato y monitorea con herramientas externas. El descuento de caché solo ayuda cuando las llamadas son lo suficientemente frecuentes para permanecer dentro del TTL.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

Optimización de Costes en OpenClaw: De $200 a $1/Mes

El Método de la Suegra: Armando la Amabilidad de Claude para Revisiones de Código Brutales
Un usuario de Reddit logra que Claude haga revisiones de código severas al presentar el código como escrito por una odiada suegra, resultando en 27 problemas encontrados a través de 4 agentes revisores hostiles después de 31 minutos de análisis profundo.

Consejos útiles de la comunidad OpenClaw: Un análisis profundo sobre la optimización de agentes de IA
Descubre consejos valiosos de la comunidad de OpenClaw sobre cómo optimizar agentes de codificación de IA para un mejor rendimiento y eficiencia. Estos conocimientos podrían revolucionar tus proyectos de IA.

Cómo prevenir la degradación de CLAUDE.md: trata las reglas como código
Después de 18 meses de uso real, un desarrollador comparte cuatro disciplinas para mantener CLAUDE.md en menos de 100 líneas: usarlo como índice, separar reglas de fuentes, auditar en cada PR y eliminar más de lo que agregas.