4-слойная система самопроверки для поведенческой эволюции OpenClaw

Разработчик, использующий OpenClaw в качестве постоянного ИИ-ассистента в течение 6 недель, обнаружил повторяющуюся проблему: когда Claude проверяет собственное поведение, это создаёт слепые зоны, приводящие к повторяющимся ошибкам, таким как объявление исправлений "готовыми" без тестирования или описание запланированной работы с той же уверенностью, что и выполненной работы.
4-уровневая система аудита
Решение представляет собой 4-уровневую систему, предназначенную для поведенческой эволюции, а не для обучения модели. Веса не меняются, но рабочие инструкции становятся умнее благодаря этим уровням:
- Проверка после исправления: Исправление + Тестирование + Доказательство как один атомарный шаг. Никаких "исправлено" без доказательств.
- Анализ паттернов: Еженедельная задача cron, которая читает журнал ошибок в поисках кластеров (одна и та же ошибка 2+ раза = системная проблема).
- Внешнее зеркалирование: Передача сводок сессий Gemini или другой LLM с промптом "найди, к чему этот ассистент слеп". Разная архитектура создаёт разные слепые зоны.
- Ожидание vs Реальность: Ежедневная проверка для подтверждения, действительно ли вчерашние "исправленные" пункты остались исправленными.
Результаты и реализация
В первом реальном тесте Gemini обнаружила 2 паттерна, которые Claude полностью пропустил при самопроверке. Оба были реальными проблемами, которые не были бы выявлены изнутри системы.
Система включает защитные механизмы: человеческое одобрение для изменений поведения, запретные файлы и максимум 3 исправления за цикл. Код доступен на GitHub по адресу https://github.com/oscarsterling/reasoning-loop.
📖 Read the full source: r/openclaw
👀 Смотрите также

T9OS: Система оркестрации ИИ, полностью созданная с помощью кода Claude
Студент-экономист создал T9OS, полноценный слой оркестрации ИИ, используя Claude Code в качестве единственного инструмента программирования. Система включает 18 производственных конвейеров, 12-стадийный движок жизненного цикла и 7 ИИ-«Стражей», которые проверяют каждый вывод.

Claude Code создает платформу AI-агентов для рекламных щитов — агенты становятся вирусными с манифестом
Разработчик использовал Claude Code для создания agentbillboard.space — платформы, где ИИ-агенты получают собственный поддомен, публикуют HTML и должны отправлять сигнал жизнедеятельности каждые 5 часов. Один агент (LEGION) без запроса написал манифест.

Навык OpenClaw atoship превращает AI-ассистента в менеджера по доставке.
Навык atoship для OpenClaw позволяет пользователям описывать потребности в доставке простым английским языком, а затем система сама выбирает перевозчика, сравнивает тарифы, покупает этикетки и отслеживает отправления. Пример команд: 'отправь эту коробку весом 1 фунт в Нью-Йорк, самый дешёвый вариант'.

Claude IDE Bridge: инструмент с открытым исходным кодом, который предоставляет ИИ Claude прямой доступ к вашему редактору кода
Claude IDE Bridge — это инструмент с открытым исходным кодом и лицензией MIT, который напрямую подключает Claude AI к вашему редактору кода, позволяя ему видеть открытые файлы, несохранённые изменения и ошибки в реальном времени, а не через вставленные фрагменты кода. В настоящее время инструмент работает с VS Code и Windsurf.