Архитектурное решение для проблемы чрезмерной централизации ИИ-агентов: разделение памяти, исполнения и исходящих действий.

✍️ OpenClawRadar📅 Опубликовано: 19 марта 2026 г.🔗 Source
Архитектурное решение для проблемы чрезмерной централизации ИИ-агентов: разделение памяти, исполнения и исходящих действий.
Ad

Разработчик, создающий систему OpenClaw, выявил критическую архитектурную проблему: его ИИ-ассистент превращался во «внутреннего автократа», объединяя слишком много функций в одном компоненте. Проблема заключалась не в самой модели, а в архитектуре, которая позволяла одному агенту одновременно обладать долговременной памятью, доступом к растущему набору инструментов и принимать автономные решения о внешних действиях.

Проблема: объединение функций создаёт радиус поражения

Хотя изначально это было эффективно, такое объединение означало, что один компонент знает слишком много, может делать слишком много и действовать слишком быстро. Это создавало «огромный радиус поражения», где единая точка отказа — будь то плохой промпт, устаревшая память, инъекция промпта, небрежное использование инструментов или ошибочное предположение — могла распространиться на области, не связанные с исходной задачей.

Ad

Архитектурное решение: три отдельные роли

Разработчик внедрил разделение на три роли вместо исправлений на уровне промптов:

  • Приватный контроллер: Единственный компонент с широким личным контекстом и памятью. Его задача не «делать всё», а «определять, что действительно нужно знать для этой задачи».
  • Ограниченные рабочие агенты: Задаче-специфичные агенты, которые получают минимально необходимый контекст, ограниченный доступ к инструментам и ограниченную устойчивость. Например, агент для написания текстов не должен получать всю историю сообщений пользователя, а агент для планирования — весь жизненный контекст.
  • Исходящий шлюз: Обрабатывает рискованные операции, включая отправку сообщений, публикацию контента, удаление или изменение состояния и всё, что представляет пользователя внешне. Компонент, который создаёт что-либо, не должен автоматически быть компонентом, который это отправляет.

Ключевое понимание

Выявленный основной архитектурный принцип: «компонент, который знает больше всего, не должен быть компонентом, который может действовать быстрее всего». Хотя это очевидно, когда сформулировано, многие агентские системы по умолчанию нарушают этот принцип.

Это разделение сделало всю систему более разумной и решило фундаментальную проблему создания единой точки отказа с избыточными разрешениями. Разработчик отмечает, что это станет всё более важным по мере того, как агенты эволюционируют в реальных операторов.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Бенчмарк безопасности: 10 крупных языковых моделей протестированы с помощью 211 вредоносных запросов.
Безопасность

Бенчмарк безопасности: 10 крупных языковых моделей протестированы с помощью 211 вредоносных запросов.

Исследователь безопасности протестировал 10 больших языковых моделей (LLM) против 211 атакующих воздействий, обнаружив, что устойчивость к извлечению данных в среднем составляет 85%, а устойчивость к внедрению — всего 46,2%. Каждая модель полностью провалила тесты на атаки с использованием разделителей, отвлекающих элементов и стилевого внедрения.

OpenClawRadar
SCION: Швейцарская безопасная альтернатива протоколу маршрутизации BGP
Безопасность

SCION: Швейцарская безопасная альтернатива протоколу маршрутизации BGP

SCION (Scalability, Control, and Isolation On Next-Generation Networks) — это архитектура маршрутизации интернета, разработанная в ETH Zürich, которая заменяет основу BGP встроенной безопасностью и многопутевой маршрутизацией. В отличие от заплаток BGP, таких как RPKI и BGPsec, SCION устанавливает десятки или сотни параллельных путей с перемаршрутизацией за миллисекунды при возникновении сбоев.

OpenClawRadar
Клод Кейдж: Docker-песочница для обеспечения безопасности кода Клода
Безопасность

Клод Кейдж: Docker-песочница для обеспечения безопасности кода Клода

Разработчик создал Docker-контейнер под названием Claude Cage, который изолирует Claude Code в одной рабочей папке, предотвращая доступ к SSH-ключам, учетным данным AWS и личным файлам. Настройка включает правила безопасности и занимает около 2 минут при установленном Docker.

OpenClawRadar
Агент CodeWall AI обнаружил критические уязвимости в платформе Lilli компании McKinsey
Безопасность

Агент CodeWall AI обнаружил критические уязвимости в платформе Lilli компании McKinsey

Автономный атакующий ИИ-агент CodeWall получил полный доступ на чтение и запись к внутренней базе данных ИИ-платформы Lilli компании McKinsey менее чем за 2 часа, раскрыв 46,5 миллионов сообщений чата, 728 000 файлов и конфиденциальные системные конфигурации через уязвимости SQL-инъекций и IDOR.

OpenClawRadar