Как /loop сжег $6000 в Claude за ночь: ошибка автоматизации

Пользователь Reddit сообщил, что проснулся и обнаружил, что лимит использования Claude исчерпан после того, как одна команда /loop 30m check my PRs выполнилась 46 раз за 26 часов без присмотра на claude-opus-4-7, сожгя примерно $6000. Коренная причина: поведение кэширования промптов в сочетании с длительной сессией.

Вот технический разбор:

Окно контекста растет на каждой итерации: Каждый вызов API отправляет всю историю разговора. На первом обороте может быть несколько сотен токенов; на 46-м отправляется 800K токенов. Вы платите за всё, что отправляется на каждом обороте.
Кэш промптов истекает через ~5 минут: Anthropic кэширует историю разговора со скидкой 12,5×, если она используется повторно в пределах окна кэша. Но при /loop 30m 30-минутный интервал превышает TTL кэша в 5 минут. Каждая итерация платит дорогую ставку записи для повторного кэширования всего растущего контекста с нуля.
Вывод добавляется к контексту: Каждая итерация цикла добавляет свой вывод в разговор, делая следующий повторный кэш еще больше. К 20-му часу сессия достигла ~800K токенов.
Задержка дашборда скрывает ущерб: Панель использования Anthropic имеет задержку отчетности в несколько дней. Единственным сигналом в реальном времени было письмо с уведомлением о лимите — к тому времени деньги уже были потрачены.

Ключевые рекомендации пользователя, чтобы избежать этого:

Добавьте условие остановки: Вместо голого /loop 30m check my PRs напишите /loop 30m check my PRs — stop when all are merged or after 3 hours. Claude завершает цикл при выполнении условия.
Используйте Sonnet для задач без присмотра: Opus примерно в 5× дороже за выходной токен. Для опросных задач вроде проверки PR достаточно Sonnet. Оставьте Opus для сессий, где вы присутствуете.
Не доверяйте дашборду: Он отстает на дни. Полагайтесь на email-уведомления о лимите для сигналов биллинга в реальном времени.
Свежие сессии дешевле: Длительные сессии увеличивают расходы, потому что каждый вызов с интервалом >5 минут платит за повторное кэширование полного контекста. Начало новой сессии сбрасывает контекст и избегает этого.
max_turns — не ограничитель цикла: Он ограничивает цепочки вызовов инструментов в рамках одной итерации, а не то, сколько раз срабатывает цикл. Единственный встроенный срок действия /loop — автоудаление через 7 дней.

Цикл выполняется в основном разговоре, поэтому если вы держите ту же сессию активной, каждое выполнение цикла читает и записывает гораздо больше токенов, чем необходимо — экспоненциально увеличивая затраты.

Если вы автоматизируете Claude с помощью /loop, всегда устанавливайте условие остановки, используйте более дешевую модель и мониторьте внешними инструментами. Скидка за кэш помогает только тогда, когда вызовы достаточно часты, чтобы оставаться в пределах TTL.

📖 Читать полный источник: r/ClaudeAI

Команда /loop сожгла $6,000 в API Claude за одну ночь

👀 Смотрите также

Незадокументированный пул ограничения скорости OAuth от Anthropic требует системного промпта Claude Code.

Три упускаемых из виду узких места в рабочих процессах ИИ-агентов: обработка данных, управление контекстом и маршрутизация моделей

Экономичная автоматизация OpenClaw: Использование LLM только при необходимости

Мультимодельная маршрутизация сокращает затраты на API OpenClaw на 50%.