Comando /loop quema $6,000 en API de Claude en una noche

Un usuario de Reddit informó que se despertó y encontró su límite de uso de Claude agotado después de que un solo comando /loop 30m check my PRs se ejecutara 46 veces durante 26 horas sin supervisión en claude-opus-4-7, quemando aproximadamente $6,000. La causa raíz: el comportamiento del caché de prompt combinado con una sesión de larga duración.

Aquí está el desglose técnico:

La ventana de contexto crece en cada iteración: Cada llamada API envía todo el historial de la conversación. La ronda 1 puede ser unos cientos de tokens; la ronda 46 envía 800K tokens. Pagas por todo lo enviado en cada ronda.
El caché de prompt caduca después de ~5 minutos: Anthropic almacena en caché el historial de la conversación con un descuento de 12.5× si se reutiliza dentro de la ventana de caché. Pero con /loop 30m, el intervalo de 30 minutos supera el TTL de caché de 5 minutos. Cada iteración paga la costosa tarifa de escritura para volver a almacenar en caché todo el contexto creciente desde cero.
La salida se agrega al contexto: Cada iteración del bucle añade su salida a la conversación, haciendo que el próximo re-caché sea aún más grande. En la hora 20, la sesión alcanzó ~800K tokens.
El retraso del tablero oculta el daño: El tablero de uso de Anthropic tiene un retraso de reporte de varios días. La única señal en tiempo real fue el correo de notificación de límite; para entonces el dinero ya se había gastado.

Las recomendaciones clave del usuario para evitar esto:

Añade una condición de parada: En lugar de /loop 30m check my PRs desnudo, escribe /loop 30m check my PRs — stop when all are merged or after 3 hours. Claude termina el bucle cuando se cumple la condición.
Usa Sonnet para tareas no supervisadas: Opus es ~5× más caro por token de salida. Para tareas de sondeo como revisiones de PR, Sonnet es suficiente. Reserva Opus para sesiones donde estés presente.
No confíes en el tablero: Tiene un retraso de días. Confía en los correos de límite de uso para señales de facturación en tiempo real.
Las sesiones nuevas son más baratas: Las sesiones de larga duración acumulan costos porque cada llamada con un intervalo >5 minutos paga por volver a almacenar en caché el contexto completo. Iniciar una nueva sesión restablece el contexto y evita esto.
max_turns no es un limitador de bucle: Limita las cadenas de llamadas a herramientas dentro de una sola iteración, no cuántas veces se dispara el bucle. La única caducidad incorporada en /loop es una eliminación automática a los 7 días.

El bucle se ejecuta en la conversación principal, así que si mantienes la misma sesión activa, cada ejecución del bucle lee y escribe muchos más tokens de los necesarios, amplificando los costos exponencialmente.

Si automatizas Claude con /loop, siempre establece una condición de parada, usa un modelo más barato y monitorea con herramientas externas. El descuento de caché solo ayuda cuando las llamadas son lo suficientemente frecuentes para permanecer dentro del TTL.

📖 Lee la fuente completa: r/ClaudeAI

Cómo un comando /loop quemó $6,000 en la API de Claude durante la noche

👀 Ver también

WhatsApp en OpenClaw: Ahorra 2 Horas Actualizando Primero a la 5.7

7 Vulnerabilidades de la Pasarela MCP: Fugas de Sesión, SSE Muerto y OAuth en Modo Pasarela

Corrección del Error de Autenticación 400: Uso del Paquete mnemonic de Python para Evitar Activadores de Filtros BIP39

Construir con Codex, Ejecutar con OpenClaw: Una División Práctica que Funciona