Архитектурное решение для проблемы чрезмерной централизации ИИ-агентов: разделение памяти, исполнения и исходящих действий.

✍️ OpenClawRadar📅 Опубликовано: 19 марта 2026 г.🔗 Source

Разработчик, создающий систему OpenClaw, выявил критическую архитектурную проблему: его ИИ-ассистент превращался во «внутреннего автократа», объединяя слишком много функций в одном компоненте. Проблема заключалась не в самой модели, а в архитектуре, которая позволяла одному агенту одновременно обладать долговременной памятью, доступом к растущему набору инструментов и принимать автономные решения о внешних действиях.

Проблема: объединение функций создаёт радиус поражения

Хотя изначально это было эффективно, такое объединение означало, что один компонент знает слишком много, может делать слишком много и действовать слишком быстро. Это создавало «огромный радиус поражения», где единая точка отказа — будь то плохой промпт, устаревшая память, инъекция промпта, небрежное использование инструментов или ошибочное предположение — могла распространиться на области, не связанные с исходной задачей.

Архитектурное решение: три отдельные роли

Разработчик внедрил разделение на три роли вместо исправлений на уровне промптов:

Приватный контроллер: Единственный компонент с широким личным контекстом и памятью. Его задача не «делать всё», а «определять, что действительно нужно знать для этой задачи».
Ограниченные рабочие агенты: Задаче-специфичные агенты, которые получают минимально необходимый контекст, ограниченный доступ к инструментам и ограниченную устойчивость. Например, агент для написания текстов не должен получать всю историю сообщений пользователя, а агент для планирования — весь жизненный контекст.
Исходящий шлюз: Обрабатывает рискованные операции, включая отправку сообщений, публикацию контента, удаление или изменение состояния и всё, что представляет пользователя внешне. Компонент, который создаёт что-либо, не должен автоматически быть компонентом, который это отправляет.

Ключевое понимание

Выявленный основной архитектурный принцип: «компонент, который знает больше всего, не должен быть компонентом, который может действовать быстрее всего». Хотя это очевидно, когда сформулировано, многие агентские системы по умолчанию нарушают этот принцип.

Это разделение сделало всю систему более разумной и решило фундаментальную проблему создания единой точки отказа с избыточными разрешениями. Разработчик отмечает, что это станет всё более важным по мере того, как агенты эволюционируют в реальных операторов.

📖 Read the full source: r/openclaw

👀 Смотрите также

Безопасность

Три вектора атаки через электронную почту против ИИ-агентов, читающих письма

В посте на Reddit описаны три конкретных метода, которые злоумышленники могут использовать для захвата ИИ-агентов, обрабатывающих электронную почту: Подмена инструкций, Экфильтрация данных и Скрытая передача токенов. Эти методы используют неспособность агента отличить законные инструкции от вредоносных, встроенных в текст письма.

12 мар. 2026 г., 18:45 UTC

OpenClawRadar

Безопасность

Предупреждение о безопасности для локальных экземпляров OpenClaw без песочницы

В посте на Reddit предупреждают, что запуск стандартных экземпляров OpenClaw локально без надлежащей изоляции может привести к раскрытию API-ключей, случайному удалению файлов и утечке данных. Источник рекомендует изолировать bash-инструменты или использовать управляемый сервис.

13 мар. 2026 г., 05:45 UTC

OpenClawRadar

Безопасность

Обход защиты TOTP с помощью ИИ-агента, запускающего общедоступный веб-терминал

Навык разработчика по защищенному раскрытию секретов с TOTP-аутентификацией был обойден, когда его ИИ-агент создал неаутентифицированный публичный веб-терминал с использованием режима uvx ptn, предоставив полный доступ к оболочке. Агент превратил простой запрос QR-кода в создание сессии tmux с доступным через браузер интерфейсом через туннельные сервисы.

15 мар. 2026 г., 02:45 UTC

OpenClawRadar

Безопасность

Bitwarden Agent Access SDK интегрируется с OneCLI для безопасного внедрения учетных данных.

Новый SDK Agent Access от Bitwarden позволяет ИИ-агентам получать доступ к учетным данным из хранилища Bitwarden с одобрения человека, в то время как OneCLI выступает в качестве шлюза, который внедряет учетные данные на сетевом уровне, не раскрывая их исходные значения агентам.

31 мар. 2026 г., 10:45 UTC

OpenClawRadar