Мультиагентные системы: Инженерные рабочие процессы против возникающего интеллекта

После создания и экспериментов с несколькими мультиагентными системами разработчик на r/LocalLLaMA утверждает, что большинство текущих реализаций решают инженерные проблемы, а не проблемы интеллекта. В посте рассматривается, что мультиагентные системы на самом деле делают хорошо и почему они пока не производят эмерджентный интеллект.
Что мультиагентные системы на самом деле делают хорошо
По опыту разработчика, мультиагентные системы в основном помогают с тремя практическими инженерными преимуществами:
- Декомпозиция задач: Вместо одного гигантского промпта рабочие процессы разделяются на несколько шагов. Пример: Агент-планировщик → решает план, Агент-исследователь → собирает информацию, Агент-писатель → генерирует контент, Агент-критик → проверяет. Это работает хорошо, но по сути является просто конвейером.
- Параллелизация: Мультиагентные настройки упрощают выполнение задач параллельно. Пример: Агент-исследователь 1 → ищет статьи, Агент-исследователь 2 → ищет новости, Агент-исследователь 3 → ищет в базах данных, с агентом-агрегатором, объединяющим результаты. Это, по сути, распределённые работники с рассуждениями LLM.
- Инженерная модульность: В реальных системах с десятками инструментов разделение агентов по ответственности помогает разработке и поддержке. Пример: Агент поиска → обрабатывает инструменты поиска, Агент базы данных → обрабатывает запросы к БД, Агент кода → обрабатывает задачи программирования, Агент-планировщик → обрабатывает рассуждения. Это в основном архитектура программного обеспечения, а не эмерджентный интеллект.
Почему «рой агентов» не производит эмерджентный интеллект (пока)
В посте выделяются три структурных ограничения:
- Общение крайне дорого: Нейроны общаются за микросекунды. Агенты общаются через вызовы LLM, которые занимают секунды, что ограничивает сложные взаимодействия.
- Агенты не могут обновлять друг друга: Нейронные сети учатся через обратное распространение ошибки. Если Агент А совершает ошибку, Агент Б может её раскритиковать, но это фактически не меняет внутреннюю модель Агента А.
- Нет общего пространства представлений: Нейроны общаются через векторы. Агенты общаются через естественный язык, который неоднозначен, подвержен потерям и дорог в токенах, что приводит к быстрой деградации информации при передаче между несколькими агентами.
На что на самом деле похожи мультиагентные системы
Разработчик заключает, что после работы с ними эти системы выглядят гораздо ближе к архитектуре микросервисов. Каждый агент по сути представляет собой: роль, набор инструментов и промпт, а система — это просто оркестрированный рабочий процесс.
Практическая ценность и будущие направления
Мультиагентные системы не бесполезны — они чрезвычайно полезны для сложных рабочих процессов, систем с большим количеством инструментов, крупных инженерных команд и распараллеливаемых задач. Однако ценность в основном заключается в инженерной масштабируемости, а не в коллективном интеллекте.
Реальный вопрос: если мы действительно хотим истинный эмерджентный мультиагентный интеллект, нам, вероятно, нужно что-то совершенно иное. Возможно, такие вещи, как: общие скрытые пространства памяти, агенты, которые обучаются политикам (многoагентное обучение с подкреплением), или графовые архитектуры рассуждений вместо конвейеров.
Сейчас большинство «мультиагентных систем» — это просто хорошо структурированные рабочие процессы с LLM.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

DeepSeek-V4 Pro и Flash: 1,6 трлн параметров, контекст в 1 млн токенов, гибридное внимание
DeepSeek-V4-Pro (1,6 трлн параметров, 49 млрд активных) и V4-Flash (284 млрд параметров, 13 млрд активных) поддерживают контекст в 1 млн токенов. Новое гибридное внимание (CSA + HCA) снижает FLOPs при инференсе одного токена до 27% и KV-кэш до 10% от DeepSeek-V3.2.

Claude Code v2.1.90 добавляет команду /powerup с игровым подходом к изучению функций.
Claude Code v2.1.90 представляет новую команду /powerup, которая предлагает геймифицированное обучение с 10 разблокируемыми улучшениями, каждое из которых обучает одной функции, которую большинство пользователей упускает. Система включает анимированные демонстрации в терминале и подробную документацию со скриншотами.

Ухудшение качества контекста в ИИ-агентах: Уровень галлюцинаций растет с увеличением количества токенов
Тестирование показывает, что уровень галлюцинаций увеличивается с ~3% при 10 тыс. токенов до ~28% при 200 тыс. токенов, при этом точность воспроизведения информации из начала сессии падает ниже 90%, как только контекст превышает 50 тыс. токенов.

Клод Соннет 4.6 Открыт: Улучшенные возможности кодирования и использования компьютеров
Claude Sonnet 4.6 представляет собой контекстное окно в 1 миллион токенов и улучшает навыки программирования и использования компьютера, что делает его серьезной альтернативой моделям класса Opus для более широкого круга задач.