Как один разработчик устранил 16 архитектурных слабых мест в своей системе AI-агентов

Архитектурные проблемы и решения
Разработчик поделился опытом исправления архитектурных слабостей в системе агента ИИ OpenClaw. Вместо того чтобы пытаться сделать систему умнее, они сосредоточились на управлении и контроле. Вот 16 проблем, которые они выявили, и как они их исправили.
Проблема 1: Угадывание места возникновения сбоев
Исправление: Определены явные слои: Чат, Встроенная среда выполнения, Оркестрация сессий, Шлюз, Реестр, Выполнение. Как только слои были отображены, сбой на Уровне 4 перестал ошибочно диагностироваться как дрейф интеллекта.
Проблема 2: Система могла выполнять действия без явной авторизации
Исправление: Введён строгий слой авторизации шлюза. Ничто не выполняется без проверки токена и подтверждения реестра. Интеллект не равен разрешению.
Проблема 3: Возможность неявного авторитета
Исправление: Запрет по умолчанию. Даже если скрытое разрешение существует где-то в контексте, оно игнорируется, если не объявлено явно в реестре. Молчание не даёт доступа.
Проблема 4: Агенты могли пытаться выполнять действия без доказательств
Исправление: Для продолжения требуются доказательства. Перед выполнением определённых возможностей агент должен продемонстрировать, что ему это разрешено. Авторизация доказывается, а не предполагается.
Проблема 5: Память могла заполняться шумом
Исправление: Шлюз продвижения. Уровень 2 фиксирует сырой опыт. Уровень 3 получает только курируемый интеллект. Нет автоматического продвижения памяти. Обучение зарабатывается.
Проблема 6: Логи накапливались, но не улучшали стабильность
Исправление: Агент сортировки логов. Ежечасный обзор. Рейтинг серьёзности от P0 до P4. Выявлены повторяющиеся проблемы. Подавление низкой серьёзности. Шум уменьшен. Сигнал сохранён.
Проблема 7: Система могла дрейфовать при запуске
Исправление: Детерминированный запуск. Проверены канонические пути. Нет резервных каталогов. Требуется выравнивание токенов. Дрейф вызывает сбой. Запуск предсказуем или он останавливается.
Проблема 8: База данных была слишком открыта
Исправление: Граница наложения. Только добавление журналирования событий. Контролируемый слой чтения/записи. Нет прямой мутации. Память защищена от правок-галлюцинаций.
Проблема 9: Поведение было разбросано по слишком многим файлам
Исправление: AGENTS.md как авторитет. Единственный источник истины о поведении. Читается при каждом запуске сессии. Архитектура памяти объявлена, а не выведена. Управление находится в одном месте.
Проблема 10: Сбой было трудно изолировать
Исправление: Ясность многоуровневой архитектуры. Как только границы стали явными, ошибки стали локализованными. Когда слои изолированы, стабильность возрастает.
Проблема 11: Обучение и выполнение были размыты
Исправление: Разделение опыта и интеллекта. Уровень 2 логирует. Уровень 3 курирует. Выполнение требует авторизации Уровня 4. Нет саморазвивающихся циклов выполнения.
Проблема 12: Вызовы инструментов могли блокироваться, но не диагностироваться
Исправление: Принуждение реестра. Реестр возможностей стал единой плоскостью управления. Если что-то не объявлено, оно не может выполняться.
Проблема 13: Предупреждения могли изменять состояние среды выполнения
Исправление: Модель быстрого отказа. Предупреждения не изменяют поведение. Сбой останавливает мутацию. Предсказуемость важнее театра устойчивости.
Проблема 14: Безопасность была основана на политиках, а не на архитектуре
Исправление: Безопасность через структуру. Запрет по умолчанию. Явное продвижение. Явная авторизация. Принуждение границ. Безопасность обеспечивается архитектурой, а не намерением.
Проблема 15: Логи были историей, а не интеллектом
Исправление: Журнал опыта только для добавления. Всё сохраняется. Ничто не используется для автономных умозаключений. Исторические данные — для криминалистического анализа, а не для автономного дрейфа.
Проблема 16: Стек был сложным, но не отображённым
Исправление: Обзор стека управления. Они определили: Уровень 1 Чат, Уровень 2 Опыт, Уровень 3 Оркестрация, Уровень 4 Авторизация, Уровень 5 Реестр, Уровень 6 Выполнение. Теперь масштаб ограничен контролем.
Что изменилось
Они перестали пытаться сделать агента умнее и сделали его подотчётным. Они заменили неявное поведение, тихий дрейф и неоднозначность разрешений на объявленную архитектуру, контролируемое продвижение и явный авторитет.
📖 Read the full source: r/openclaw
👀 Смотрите также

Разработчик делится проблемой стоимости токенов в ERP-системе, созданной с помощью Claude.
Владелец бизнеса по грузоперевозкам создал ERP-систему на 3000+ строк кода с помощью Claude, но теперь сталкивается с затратами в 60 000–80 000 токенов на сообщение из-за загрузки всего единого HTML-файла. Они рассматривают модуляризацию или миграцию на Firebase для снижения затрат.

Как Клод превратил сайт не-разработчика в 10 тысяч пользователей с помощью SEO и AEO
Неразаработчик использовал Claude для SEO-стратегии контента, AEO-оптимизации и технических аудитов, чтобы развить маркетплейс AI-навыков с 0 до 10 000 активных пользователей за 6 недель без затрат на рекламу.

Разработчик предоставляет Клоду корневой доступ к коду, переворачивая рабочий процесс разработки.
Разработчик предоставил Claude Code полный доступ к своему серверу, отслеживал все команды и обнаружил, что он вносил спокойные, методичные изменения, которые устраняли первопричины, а не только симптомы. Это привело к пересмотру их рабочего процесса в пользу разработки непосредственно в среде, клонированной с продакшена.

Jetson Orin Nano Super: Сервер OpenClaw за $20 в год
Участник сообщества показал свою сверхэкономичную установку OpenClaw на оборудовании NVIDIA — работает 24/7 всего за $20 в год на электричестве.