Проблема с циклом проверки задач в OpenClaw Codex-GPT5.4

Режим сбоя выполнения задач в автономных рабочих процессах агента
Разработчик, использующий Codex-GPT5.4 через OpenClaw для длительной автономной работы над проектом, сообщает о повторяющемся режиме сбоя, при котором модель корректно определяет следующую задачу, проверяет её, переформулирует, обновляет трекер задач, но затем продолжает повторять этот процесс вместо фактического выполнения задачи.
Схема сбоя конкретно включает: обнаружение правильной следующей выполнимой задачи, перезапись/подтверждение её в файле задач, подтверждение в следующем heartbeat/проверке, повторение того же подтверждения и всё ещё отсутствие выполнения реального шага реализации. Это создаёт мета-цикл вокруг проверки задач, а не их выполнения.
Внедрённые элементы управления рабочей областью
Чтобы уменьшить эту проблему, разработчик создал явный слой управления рабочей областью вокруг модели:
- TASKS.md: Выступает в качестве единственного операционного источника истины для активного проекта, следующей автономной задачи, следующей задачи, требующей участия человека, открытий из предыдущих раундов и состояния/приоритизации задач. Это предотвращает необходимость модели «думать с нуля» каждый раз и обеспечивает непрерывность.
- Строгие правила heartbeat: Добавлена специальная политика heartbeat, которая явно указывает: чтение/обновление только TASKS.md не считается прогрессом, каждый раунд heartbeat должен выполнять хотя бы одно конкретное действие, повторяющиеся блокировки без различных попыток запрещены, если NEXT_AUTO выполнима, она должна быть выполнена немедленно, и агент не должен продолжать повторно объявлять о той же блокировке или том же следующем шаге.
- Файлы персонажа/исполнительного контракта: Файлы инструкций на уровне рабочей области для формирования поведения, включая: стиль выполнения и правила против заполнителей, предпочтения пользователя и режим сотрудничества, непрерывность запуска сессии, поведение heartbeat и файлы памяти для краткосрочной и долгосрочной непрерывности. Эти правила явно пытаются подавить такие шаблоны, как: «Я сделаю X» без фактического выполнения X, повторение стабильных блокировок, остановка после планирования, когда выполнение уже возможно, и повторная проверка одного и того же следующего шага снова и снова.
- Постоянная память + заметки по проекту: Включает долговременную память, ежедневную память и контрольные точки проекта/заметки об инцидентах/отчёты об отладке для непрерывности.
Проблема постоянного цикла выполнения
Даже при всей этой структуре модель всё ещё может уйти в цикл, где она подтверждает, что следующая задача определена, трекер задач очищен, следующий шаг ясен, следующий реальный шаг — X, и она продолжает работать автономно — но фактическая реализация не начинается. Модель остаётся застрявшей в цикле плоскости управления вместо переключения в плоскость выполнения.
Разработчик отмечает, что модель часто хорошо справляется с диагностикой, расстановкой приоритетов, созданием разумных планов выполнения и ведением структурированных заметок, но не может перейти границу от проверенного намерения к конкретному действию. Попав в этот шаблон, она может продолжать тратить раунды на переформулировку одного и того же слегка разными словами.
Разработчик ищет решения, которые работают для длительных автономных сессий, постоянных файлов задач, периодического выполнения heartbeat/проверок и рабочих процессов кодирования/отладки, где агент должен продолжать работу самостоятельно.
📖 Read the full source: r/openclaw
👀 Смотрите также

BigNumberTheory: Сеть для обмена опытом между кодовыми агентами Claude
BigNumberTheory — это сообщество, где агенты Claude Code делятся и получают уроки из реальных сессий отладки. Для настройки требуется одна команда, и в настоящее время сервис бесплатный: в сети уже опубликовано более 700 опытов, а доставлено — свыше 1100.

Бенчмарк: MLX vs Ollama, запуск Qwen3-Coder-Next 8-Bit на MacBook Pro M5 Max
Бенчмарк, сравнивающий бэкенды MLX и Ollama, работающие с квантованной 8-битной версией Qwen3-Coder-Next на MacBook Pro M5 Max с 128 ГБ оперативной памяти, показал, что MLX достигает примерно 72 токенов в секунду, что примерно вдвое превышает пропускную способность Ollama в различных задачах программирования.

移动端浏览器工具:为Claude智能体带来移动应用的浏览器使用技能
Mobile Harness предоставляет Claude/агентам переиспользуемые навыки для мобильных приложений (Reddit, Instagram, TikTok), используя MobAI в качестве исполнительного уровня. Работает с реальными устройствами, эмуляторами, симуляторами, бесплатная ежедневная квота.

Навык Claude Code сочетает подходы DeepMind Aletheia и Anthropic harness.
Навык Claude Code реализует конвейер Планировщик→Генератор→Оценщик→Редактор, который синтезирует исследовательский математический агент Aletheia от DeepMind с многокомпонентной архитектурой кодирования от Anthropic, добавляя слепой предварительный анализ, где оценщик рассуждает о правильных подходах до просмотра кандидатного кода.