Многократные сбои в работе агентов — это сбои в организации, а не в подсказках

В большинстве многолетних систем рано или поздно возникает одна и та же проблема: агенты перекидывают задачи друг другу, рецензенты бесконечно просят «еще один проход», исследователи порождают бесчисленные подтемы, вызовы инструментов растут до предела рекурсии. В документации фреймворков это называют «циклами» и предлагают параметр максимального числа итераций. Одна из набирающих популярность гипотез заключается в том, что этот параметр лечит лишь симптом, а настоящая причина — в организации агентов.
Повторяющийся паттерн: когда агенты спроектированы как равноправные (исследователь общается с аналитиком, аналитик — с писателем, писатель возвращает рецензенту), никто явно не отвечает за результат. Каждый агент может просить другого о дополнительной работе. Формально существуют условия остановки, но ни один агент не имеет полномочий сказать: «Готово, завершаем выполнение». Эти полномочия подразумеваются, но размываются в сети равноправных узлов.
Решение — рассматривать сеть агентов как организационную структуру с явными линиями подчинения, а не как чат равных. Предлагаемые уровни:
- Председатель (высший уровень, может завершить)
- Стратегический отдел
- Руководитель дивизиона
- Тимлид
- Специалист-исполнитель
- ОКК и Политики — отдельные штабные подразделения, которые могут отклонять и эскалировать, но не могут порождать неограниченную новую работу
Ключевая механика:
- Один ответственный владелец миссии на запуск
- Один владелец на рабочий поток
- Ограниченная глубина делегирования
- Типизированный контракт возврата для каждого работника: статус, доказательства, результат, блокеры, следующее действие
- Только менеджер имеет право возобновить или завершить
- Память хранится на уровнях власти; специалисты получают только контекст своей задачи
В частности, сценарий бесконечных рецензий устраняется, когда проверяющим структурно разрешен один проход с отклонением, после чего они обязаны эскалировать.
Существующие фреймворки уже имеют примитивы:
- CrewAI — иерархический процесс, где менеджер проверяет результат работника
- LangGraph — супервайзеры, сабагенты и явный лимит рекурсии
- OpenAI Agents SDK — оркестрация по типу менеджера, отличная от равноправной передачи задач
- AutoGen — GroupChatManager
- Anthropic — исследовательская система оркестратор-работник
Недооцененная идея: рассматривать менеджера не как модератора открытого группового чата, а как формальную линию подчинения с полномочиями на завершение.
Две открытые проблемы:
- Иерархия может сама стать узким местом — если каждое решение уходит наверх, председатель превращается в единую точку задержки и сбоя.
- Эскалация как функция работает только если у руководителя есть реальные полномочия на остановку. Если председатель просто вызывает еще одну LLM, которая вызывает еще LLM, цикл просто перемещается этажом выше.
Репозиторий с предлагаемой структурой: github.com/jeongmk522-netizen/agentlas_org_chart
📖 Источник: r/openclaw
👀 Смотрите также

Бенчмарк проверки кода ИИ: сравнение Claude, Gemini, Codex, Qwen и MiniMax
В ходе тестирования пять моделей ИИ были протестированы на 15 пулл-реквестах Milvus с известными багами. Claude обнаружил 53% багов в режиме raw, в то время как состязательные дебаты между моделями увеличили обнаружение до 80%.

Плагин Claude Code /verify: автоматическое тестирование браузера из вашего плана
/verify — это плагин с открытым исходным кодом для Claude Code, который читает ваш план, запускает настоящий браузер через Playwright MCP, проверяет каждое требование и выдает отчет о прохождении/непрохождении со скриншотами.

Garry Tan's gstack: Открытая фреймворк-платформа для ИИ-агентов на основе Claude Code
gstack от Гарри Тана — это фабрика программного обеспечения с открытым исходным кодом, которая превращает Claude Code в виртуальную инженерную команду с 13 специализированными слеш-командами для планирования, проектирования, разработки, ревью, контроля качества и управления выпуском.

Сервер MCP для контекста кодовой базы с упаковкой по глубине
Новый MCP-сервер упаковывает контекст кодовой базы на 5 уровнях глубины в рамках лимита токенов, решая проблему, когда ИИ-агенты для программирования либо загружают слишком мало файлов, либо получают плоскую карту репозитория без фактического содержимого.