6 типов циклов, обнаруженных в производственных AI-агентах: анализ логов за неделю

Пользователь Reddit запустил 5 продакшн-агентов (поддержка, стратегический оркестратор, ревьюер кода, стратегический исполнитель, монитор сделок) на неделю, записав 670 событий. Они выявили 6 типов циклов высокой степени серьезности, которые часто остаются незамеченными до получения ежемесячного счета от OpenAI. Вот шаблоны, обобщенные для практической отладки.
6 типов циклов
- Колебание решений: Агент 6 раз переключается между 2 значениями для одного и того же ключа. Логи показывают каждый раз решительный ответ, но он чередуется между двумя одинаковыми вариантами.
- Цикл повторных попыток: 15 последовательных вызовов одного и того же инструмента с одинаковыми аргументами, все 15 завершились неудачей. Никакой автоматический выключатель не остановил процесс. Коды статуса были пустыми, что привело к тихому сбою.
- Цикл пинг-понга: Два агента (стратегический оркестратор и стратегический исполнитель) попеременно пишут в один и тот же ключ общей памяти, каждый «исправляя» запись другого. Обнаружено после 6 записей.
- Цикл чтения-записи: Агент читает память, пишет исправленную версию, которая на 100% идентична предыдущей записи. Повторяется 5 циклов. Чистая трата ресурсов.
- Цикл рефлексии: 3 последовательные записи в один и тот же ключ, каждая как минимум на 84% похожа на предыдущую. Саморефлексия превращается в само-размышление.
- Недетерминизм инструмента: 5 успешных вызовов одного и того же инструмента с одинаковыми аргументами каждый раз дают разные результаты. Это не совсем цикл, но это убивает кэширование и вызывает постоянные переоценки ниже по потоку.
Пользователь отмечает, что устранение этих шаблонов решило около 90% проблем, но это не идеально. Он рекомендует добавить автоматические выключатели, проверки на дублирование и пороги схожести, чтобы обнаруживать циклы до их эскалации.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Снижение галлюцинаций Claude с помощью инъекции промптов перед выводом
Пользователь Reddit поделился методом сокращения галлюцинаций Claude AI примерно вдвое с помощью предварительного промпта, который заставляет модель фиксировать неопределенности и следующие шаги перед ответом. Подход включает добавление специальных инструкций в markdown в системный промпт Claude и создание Python-скрипта.

Коды промптов Claude перепроверены: L99 острее, OODA уже, ARTIFACTS потускнели, и 3 новых кода для использования
Повторное тестирование через 6 месяцев промпт-кодов L99, OODA и ARTIFACTS на Claude показывает: L99 стал острее на Sonnet 4.6/Opus 4.7, OODA не справляется со стратегическими запросами, ARTIFACTS необязателен для кода, а три новых кода (/skeptic, /blindspots, /decompose) заслуживают ежедневного использования. Не используйте более 2 кодов одновременно.

Команда /loop сожгла $6,000 в API Claude за одну ночь
Разработчик оставил без присмотра команду /loop с запуском каждые 30 минут на claude-opus-4-7, что за одну ночь привело к расходу $6000 из-за истечения кэша промптов и растущего контекста — поучительная история для автоматизации AI-агентов.

禁用 Opus 4.7 人类步调行为的 CLAUDE.md 条目
Три директивы CLAUDE.md, которые отключают предложения перерыва, завышенные оценки времени и разбиение на фазы в Claude 4.7 Opus во время длительных сессий программирования.