Практические советы по архитектуре многоагентных систем на основе опыта

Разработчик на r/openclaw поделился практическими советами по архитектуре мультиагентных ИИ-систем на основе опыта создания системы из 7 агентов, работающей ежедневно. Советы появились после помощи другому разработчику, который застрял на архитектурных решениях при создании конвейера автоматизации контента.
Ключевые архитектурные паттерны
Разработчик описывает пять конкретных подходов, работающих на практике:
- Начните с одного агента: Не начинайте с нескольких агентов. Сначала заставьте работать одного агента, поймите его, затем добавьте второго только тогда, когда первый упрётся в проблему, которую не может решить самостоятельно. Большинству бизнесов нужно максимум 2-4 агента — упомянутая система автоматизации для парикмахерской работает на 4 агентах.
- Используйте паттерн оркестратора: Один агент, который видит всё и распределяет работу между специалистами. Не демократия и не циклический подход — «один мозг, много рук».
- Внедрите общую память с JSON-файлами: Агенты, которые не видят работу друг друга, будут дублировать, противоречить и тратить токены. Решение — общий каталог «мозга» с использованием JSON-файлов, которые каждый агент читает перед началом и записывает после завершения. Простой подход — база данных или векторное хранилище не нужны.
- Маршрутизируйте модели по задачам: Не каждому агенту нужны дорогие модели. Контент-агент разработчика работает на Sonnet, исследовательский агент — на бесплатной модели, тогда как только оркестратор и операторы сложных задач получают дорогие модели. Этот подход может сэкономить 80% бюджета.
- Добавьте циклы подтверждения: Каждый агент публикует свою работу в канале. Оркестратор проверяет — если проходит, отправляет дальше; если нет, возвращает с комментариями. Ничто не покидает систему без проверки.
Практическая реализация
Ключевая идея — избегать избыточного проектирования заранее. Разработчик, который просил помощи, застрял, потому что пытался спроектировать всю систему сразу. Вместо этого советуют построить одного агента, решить одну проблему, затем добавить следующего агента только когда первый докажет свою работоспособность.
Подход с общей памятью через JSON-файлы предоставляет лёгкое решение для координации агентов без сложной инфраструктуры. Маршрутизация моделей по специфике задач помогает контролировать расходы, сохраняя производительность там, где это наиболее важно.
📖 Read the full source: r/openclaw
👀 Смотрите также

Интеграция OpenClaw с WhatsApp Cloud API
Разработчик настроил OpenClaw для прямого взаимодействия с WhatsApp через официальный облачный API Meta и задокументировал процесс настройки, чтобы помочь другим избежать разрозненной документации.

Qwen3.5-397B MoE работает на 14 ГБ ОЗУ с помощью постраничной загрузки экспертов на M1 Ultra
Движок Paged MoE держит в памяти только 20 экспертов, а остальные подгружает с SSD, запуская модель 397B размером 209GB на Mac Studio с 64GB памяти, достигая 1,59 ток/с и пикового использования RAM 14GB. Включает бенчмарки меньших моделей.

Трехуровневая архитектура памяти для постоянного контекста агента OpenClaw
Разработчик создал трехслойную систему памяти на основе инфраструктуры OpenClaw, чтобы предотвратить запуск агентов без контекста в начале каждой сессии. Архитектура включает L1 (рабочие файлы, внедряемые на каждом шаге), L2 (семантический поиск по памяти) и L3 (справочные документы, открываемые по требованию).

Что ломается при запуске кодирующих агентов на маленьких локальных моделях
Реальные точки отказа при тестировании многофайловых задач на моделях меньше 7B: ограждения Markdown, надежность структурированного вывода, ошибки редактирования файлов и классификация действий на чтение и запись.