Cómo un comando /loop quemó $6,000 en la API de Claude durante la noche

✍️ OpenClawRadar📅 Publicado: 1 de mayo de 2026🔗 Source
Cómo un comando /loop quemó $6,000 en la API de Claude durante la noche
Ad

Un usuario de Reddit informó que se despertó y encontró su límite de uso de Claude agotado después de que un solo comando /loop 30m check my PRs se ejecutara 46 veces durante 26 horas sin supervisión en claude-opus-4-7, quemando aproximadamente $6,000. La causa raíz: el comportamiento del caché de prompt combinado con una sesión de larga duración.

Aquí está el desglose técnico:

  • La ventana de contexto crece en cada iteración: Cada llamada API envía todo el historial de la conversación. La ronda 1 puede ser unos cientos de tokens; la ronda 46 envía 800K tokens. Pagas por todo lo enviado en cada ronda.
  • El caché de prompt caduca después de ~5 minutos: Anthropic almacena en caché el historial de la conversación con un descuento de 12.5× si se reutiliza dentro de la ventana de caché. Pero con /loop 30m, el intervalo de 30 minutos supera el TTL de caché de 5 minutos. Cada iteración paga la costosa tarifa de escritura para volver a almacenar en caché todo el contexto creciente desde cero.
  • La salida se agrega al contexto: Cada iteración del bucle añade su salida a la conversación, haciendo que el próximo re-caché sea aún más grande. En la hora 20, la sesión alcanzó ~800K tokens.
  • El retraso del tablero oculta el daño: El tablero de uso de Anthropic tiene un retraso de reporte de varios días. La única señal en tiempo real fue el correo de notificación de límite; para entonces el dinero ya se había gastado.

Las recomendaciones clave del usuario para evitar esto:

  1. Añade una condición de parada: En lugar de /loop 30m check my PRs desnudo, escribe /loop 30m check my PRs — stop when all are merged or after 3 hours. Claude termina el bucle cuando se cumple la condición.
  2. Usa Sonnet para tareas no supervisadas: Opus es ~5× más caro por token de salida. Para tareas de sondeo como revisiones de PR, Sonnet es suficiente. Reserva Opus para sesiones donde estés presente.
  3. No confíes en el tablero: Tiene un retraso de días. Confía en los correos de límite de uso para señales de facturación en tiempo real.
  4. Las sesiones nuevas son más baratas: Las sesiones de larga duración acumulan costos porque cada llamada con un intervalo >5 minutos paga por volver a almacenar en caché el contexto completo. Iniciar una nueva sesión restablece el contexto y evita esto.
  5. max_turns no es un limitador de bucle: Limita las cadenas de llamadas a herramientas dentro de una sola iteración, no cuántas veces se dispara el bucle. La única caducidad incorporada en /loop es una eliminación automática a los 7 días.

El bucle se ejecuta en la conversación principal, así que si mantienes la misma sesión activa, cada ejecución del bucle lee y escribe muchos más tokens de los necesarios, amplificando los costos exponencialmente.

Ad

Si automatizas Claude con /loop, siempre establece una condición de parada, usa un modelo más barato y monitorea con herramientas externas. El descuento de caché solo ayuda cuando las llamadas son lo suficientemente frecuentes para permanecer dentro del TTL.

📖 Lee la fuente completa: r/ClaudeAI

Ad

👀 Ver también