Сравнение мультиагентных систем ИИ: Harness от Anthropic и модель инженерной организации Agyn

✍️ OpenClawRadar📅 Опубликовано: 31 марта 2026 г.🔗 Source

Anthropic опубликовала дизайн фреймворка для разработки долгоиграющих приложений, в то время как мультиагентная система Agyn для командной автономной разработки ПО была открыта в прошлом месяце на arXiv. Оба подхода отвергают модель «монолитного агента» и вместо этого структурируют ИИ-агентов для работы как реальные инженерные команды с разделением ролей, структурированными передачами и циклами проверки.

Ключевые различия в архитектуре

Система Anthropic использует архитектуру, вдохновлённую GAN, с тремя ролями: планировщик → генератор → оценщик. Оценщик использует Playwright для взаимодействия с запущенным приложением, как реальный пользователь, а затем предоставляет структурированную критику генератору.

Agyn моделирует процесс как инженерную организацию с четырьмя ролями: координация → исследование → реализация → проверка. Агенты работают в изолированных песочницах и общаются через определённые контракты.

Общие решения для типичных проблем

Потеря связности моделей в длительных задачах: Anthropic использует сброс контекста со структурированными артефактами передачи, в то время как Agyn использует сжатие со структурированными передачами между ролями
Слишком мягкая самооценка: Обе системы отделяют оценку от генерации. Anthropic использует отдельного агента-оценщика, откалиброванного на нескольких примерах, в то время как у Agyn есть выделенная роль проверки, отделённая от реализации
Неоднозначные критерии завершения: Anthropic использует спринт-контракты, согласованные до начала работы, в то время как Agyn имеет фазу спецификации задач с явными критериями приёмки и необходимыми тестами
Сложная декомпозиция задач: Планировщик Anthropic расширяет односложные промпты в полные спецификации, в то время как агент-исследователь Agyn декомпозирует задачи и создаёт спецификации до начала реализации
Тревога контекста: Anthropic использует сбросы для чистого листа, в то время как Agyn использует сжатие со слоем памяти

Отличительные особенности Agyn

Agyn включает две функции, отсутствующие во фреймворке Anthropic:

Изолированные песочницы для каждого агента: Каждый агент работает в своём собственном изолированном файловом и сетевом пространстве имён, предотвращая конфликты из-за общего состояния во время параллельной или последовательной работы
GitHub как общее состояние: Система использует примитивы GitHub (коммиты, комментарии, PR, ревью), которые уже понимают человеческие команды, предоставляя полный журнал аудита без необходимости в пользовательских протоколах связи

Различия в реализации

Фреймворк Anthropic тесно построен вокруг Claude с использованием Claude Agent SDK и Playwright MCP для цикла оценки. Оценщик навигает по живым запущенным приложениям перед выставлением оценки.

Agyn по замыслу является модель-агностиком, поддерживая Claude, Codex и модели с открытыми весами. Система позволяет смешивать разные модели для каждой роли, что на практике оказалось эффективнее, чем использование одной модели для всего.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Хеддл: Принудительное обеспечение доверия и ведение журнала аудита для подключений Claude Desktop MCP

Heddle — это инструмент с открытым исходным кодом, который добавляет уровни доверия, контроль доступа и журнал аудита к MCP-подключениям Claude Desktop, позволяя безопасно управлять несколькими сервисами через единый интерфейс с шестью стартовыми пакетами.

6 апр. 2026 г., 11:45 UTC

OpenClawRadar

Инструменты

Приложение для системного трея Windows для мониторинга использования API Claude в реальном времени

Разработчик создал легковесное приложение для системного трея Windows, которое отображает использование квоты API Claude в реальном времени, включая окна в 5 часов и 7 дней, количество токенов за сегодня и прогнозы исчерпания. Приложение поддерживает интерфейс на корейском, английском, китайском и японском языках и является открытым исходным кодом на GitHub.

15 апр. 2026 г., 12:49 UTC

OpenClawRadar

Инструменты

Сервер RiserFlow MCP расширяет возможности OpenClaw, добавляя функции электронной коммерции.

Открытый MCP-сервер под названием RiserFlow позволяет OpenClaw выполнять семантический поиск товаров, управлять корзинами и размещать реальные заказы, которые отображаются в системах администрирования магазинов, с текущей поддержкой Bitrix и шаблоном адаптера для других платформ.

25 мар. 2026 г., 07:45 UTC

OpenClawRadar

Инструменты

CC-Ledger: Отслеживайте затраты Claude Code за сессию и PR с помощью локального SQLite

CC-Ledger — это Rust-бинарник, который подключается к Claude Code и записывает каждый запрос в локальную SQLite. Отслеживайте неконтролируемые сессии в реальном времени и получайте разбивку затрат на PR без необходимости в API-ключе. Включает строку меню macOS, веб-панель и CLI.

22 мая 2026 г., 00:17 UTC

OpenClawRadar