Управление сбоями ИИ-агентов: Лимиты повторных попыток и бюджеты на ошибки

Это кейс от команды, управляющей 6 ИИ-агентами в продакшене, с акцентом на то, как их очередь задач обрабатывает режимы сбоев, выходящие за рамки простого распределения задач.
Ключевой инцидент и решение
Один из ранних инцидентов заключался в том, что агент достиг лимита скорости, потерпел неудачу, был повторно запущен, снова достиг лимита, и этот цикл повторился 319 раз. Это привело к потере часов вычислительных ресурсов на задачу, которая никогда не могла быть выполнена успешно.
Внедренное решение — бюджет на 3 неудачи. После 3 неудач задача помечается как окончательно неудачная вместо повторной постановки в очередь.
Другие режимы сбоев, которые были учтены
- Агенты принимают задачи, но перестают отвечать (решается таймаутами heartbeat)
- Агенты сообщают TASK_COMPLETE без фактического завершения задачи (проблема самоотчета)
- Два агента захватывают одну и ту же задачу (решается оптимистической блокировкой)
Команда отмечает, что хотя правило 3 неудач кажется очевидным ретроспективно, его было жестоко открыть на собственном опыте.
📖 Read the full source: r/clawdbot
👀 Смотрите также

Автоматизированный Утренний Компаньон с Генерацией Обоев с Цитатами с Использованием Remotion
Разработчик создал автоматизированного утреннего компаньона, который извлекает цитаты из 107 книг в хранилище Obsidian, генерирует персонализированные сводки с обсуждениями Reddit и темами для дневника, а затем создает пользовательские обои с помощью Remotion с выбором дизайна на основе ИИ.

Клод Опус 4.6 против Соннета 4.6 для философской аргументации: прямое сравнение пользователя
Подробное сравнение Claude Opus 4.6 и Sonnet 4.6 для философской и гуманитарной работы показывает, что Opus превосходит в аналитическом разложении, но упрощает подтекст, в то время как Sonnet лучше улавливает нюансы, но имеет более слабый стиль письма. Пользователь обнаружил, что Opus утомителен для мышления, насыщенного импликациями, и переключился на Sonnet.

UPSC StatsBuddy Bot: Телеграм-интерфейс для данных правительства Индии через Claude AI
Разработчик создал Telegram-бота под названием UPSC StatsBuddy, который подключается к серверу MCP индийского Министерства статистики и программной реализации (MoSPI), используя Claude AI для преобразования сложных государственных наборов данных в понятные, цитируемые ответы для абитуриентов UPSC менее чем за 30 часов.

Использование Claude Code для создания сайта на Drupal с пользовательскими шаблонами Twig
Разработчик использовал Claude Code для создания сайта на Drupal с пользовательскими шаблонами Twig и чистым HTML, обойдя традиционную тематизацию Drupal. Они использовали ddev для локальной разработки и специфические команды для настройки типов контента, представлений и таксономий.