Команда /loop сожгла $6,000 в API Claude за одну ночь

✍️ OpenClawRadar📅 Опубликовано: 1 мая 2026 г.🔗 Source
Команда /loop сожгла $6,000 в API Claude за одну ночь
Ad

Пользователь Reddit сообщил, что проснулся и обнаружил, что лимит использования Claude исчерпан после того, как одна команда /loop 30m check my PRs выполнилась 46 раз за 26 часов без присмотра на claude-opus-4-7, сожгя примерно $6000. Коренная причина: поведение кэширования промптов в сочетании с длительной сессией.

Вот технический разбор:

  • Окно контекста растет на каждой итерации: Каждый вызов API отправляет всю историю разговора. На первом обороте может быть несколько сотен токенов; на 46-м отправляется 800K токенов. Вы платите за всё, что отправляется на каждом обороте.
  • Кэш промптов истекает через ~5 минут: Anthropic кэширует историю разговора со скидкой 12,5×, если она используется повторно в пределах окна кэша. Но при /loop 30m 30-минутный интервал превышает TTL кэша в 5 минут. Каждая итерация платит дорогую ставку записи для повторного кэширования всего растущего контекста с нуля.
  • Вывод добавляется к контексту: Каждая итерация цикла добавляет свой вывод в разговор, делая следующий повторный кэш еще больше. К 20-му часу сессия достигла ~800K токенов.
  • Задержка дашборда скрывает ущерб: Панель использования Anthropic имеет задержку отчетности в несколько дней. Единственным сигналом в реальном времени было письмо с уведомлением о лимите — к тому времени деньги уже были потрачены.

Ключевые рекомендации пользователя, чтобы избежать этого:

  1. Добавьте условие остановки: Вместо голого /loop 30m check my PRs напишите /loop 30m check my PRs — stop when all are merged or after 3 hours. Claude завершает цикл при выполнении условия.
  2. Используйте Sonnet для задач без присмотра: Opus примерно в 5× дороже за выходной токен. Для опросных задач вроде проверки PR достаточно Sonnet. Оставьте Opus для сессий, где вы присутствуете.
  3. Не доверяйте дашборду: Он отстает на дни. Полагайтесь на email-уведомления о лимите для сигналов биллинга в реальном времени.
  4. Свежие сессии дешевле: Длительные сессии увеличивают расходы, потому что каждый вызов с интервалом >5 минут платит за повторное кэширование полного контекста. Начало новой сессии сбрасывает контекст и избегает этого.
  5. max_turns — не ограничитель цикла: Он ограничивает цепочки вызовов инструментов в рамках одной итерации, а не то, сколько раз срабатывает цикл. Единственный встроенный срок действия /loop — автоудаление через 7 дней.

Цикл выполняется в основном разговоре, поэтому если вы держите ту же сессию активной, каждое выполнение цикла читает и записывает гораздо больше токенов, чем необходимо — экспоненциально увеличивая затраты.

Ad

Если вы автоматизируете Claude с помощью /loop, всегда устанавливайте условие остановки, используйте более дешевую модель и мониторьте внешними инструментами. Скидка за кэш помогает только тогда, когда вызовы достаточно часты, чтобы оставаться в пределах TTL.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Пять распространенных ошибок при настройке OpenClaw, которые приводят к потере денег и создают угрозы безопасности
Советы

Пять распространенных ошибок при настройке OpenClaw, которые приводят к потере денег и создают угрозы безопасности

На основе анализа более 50 конфигураций OpenClaw, одни и те же пять проблем возникают снова и снова: использование Opus в качестве модели по умолчанию вместо Sonnet для большинства задач, отсутствие запуска новых сессий, установка навыков без чтения исходного кода, открытие шлюза для сети и добавление второго агента до исправления первого.

OpenClawRadar
Использование ntfy для уведомлений агента OpenClaw
Советы

Использование ntfy для уведомлений агента OpenClaw

Разработчик делится опытом использования самодельной версии ntfy.sh для push-уведомлений от агентов OpenClaw, избегая ботов Discord/Telegram, запуская ntfy serve на том же VPS и используя HTTP POST-запросы.

OpenClawRadar
Перестаньте использовать Claude как дорогой автозаполнитель — создайте SDR-систему с определениями ролей, файлами памяти и ритуалами доработки
Советы

Перестаньте использовать Claude как дорогой автозаполнитель — создайте SDR-систему с определениями ролей, файлами памяти и ритуалами доработки

Пост на Reddit утверждает, что большинство отделов продаж используют Claude как «чат-бота», а не как систему. Решение: определить роль, вести файл памяти с ICP/тоном/наработками и проводить еженедельный ритуал доработки, чтобы повышать качество результатов.

OpenClawRadar
Как перенаправление простых задач на более дешёвые модели сократило затраты на ИИ на 40%
Советы

Как перенаправление простых задач на более дешёвые модели сократило затраты на ИИ на 40%

Пользователь OpenClaw сократил свои расходы на ИИ на 40%, проанализировав журналы использования и перенаправляя простые задачи, такие как операции с файлами и вопросы-ответы, на более дешёвые модели, такие как DeepSeek-v3 и Gemini Flash, оставляя Claude Sonnet для сложных задач рассуждения.

OpenClawRadar