Bernstein: оркестратор ИИ-агентов как Kubernetes с верификацией

Bernstein — это оркестратор для ИИ-агентов программирования, который создатель описывает как «Kubernetes для агентов программирования». В отличие от более простых инструментов, запускающих агентов в параллельных рабочих деревьях, Bernstein решает то, что разработчик называет «остальными 95%» проблемы.

Ключевые особенности

Система включает несколько критически важных компонентов:

Проверка: Компонент «уборщик» независимо проверяет выходные данные агентов после каждой задачи. Он запускает тесты, проверяет различия и анализирует вывод, потому что «агенты лгут» — они могут утверждать, что тесты пройдены, когда это не так, или говорить, что файлы зафиксированы, хотя это не было сделано.
Движок политик моделей: Предоставляет списки разрешений/запретов для каждого провайдера, ограничения на резидентность данных, предпочтительную маршрутизацию и потолки затрат. Создатель сравнивает это с «сетевыми политиками K8s, но для провайдеров LLM».
Детерминированное планирование: Использует чистый Python для планирования вместо LLM, создавая детерминированный поток управления с нулевым расходом токенов LLM на координацию. Эпсилон-жадный бандит со временем обучается маршрутизации.
Агентно-независимый дизайн: Включает 13 адаптеров для Claude Code, Codex, Gemini CLI, Cursor, Qwen, Aider, Amp, Roo Code, Goose, Kilo, Kiro, OpenCode и универсальных агентов. Claude Code имеет наиболее глубокую интеграцию.
Функции масштабирования: При объёме более 500K строк и ~5000 тестов Bernstein включает автоматические выключатели, обнаружение аномалий затрат, обнаружение циклов, обнаружение взаимоблокировок, сканирование на наличие персональных данных, HMAC-цепочки аудиторских журналов, прогрессивные разрешения и карантин для подозрительного вывода.
Саморазвитие: Может развивать себя с помощью bernstein --evolve.

Технические детали

Создатель отмечает, что запуск агентов в рабочих деревьях — это «привет, мир в этой области» и что большинство фреймворков для мультиагентных систем используют LLM для планирования других LLM, что «медленно, дорого и недетерминировано». Подход Bernstein использует чистый Python для детерминированного потока управления.

Проект был протестирован в масштабе с более чем 500K строк кода и примерно 5000 тестов. Разработчик создал такие функции, как автоматические выключатели и обнаружение аномалий, потому что «вещи ломались, и это были исправления».

Создатель — единственный разработчик из Израиля, который упоминает, что «строил под ракетами (буквально)» и что проект перерос его, и он ищет участников.

📖 Read the full source: r/ClaudeAI

Бернштейн: Оркестратор, подобный Kubernetes, для ИИ-агентов программирования с верификацией и политиками моделей

Ключевые особенности

Технические детали

👀 Смотрите также

Когтевой Код-Агент: Переписывание архитектуры кода Клода на Python для локальных моделей

Категории плагинов OpenClaw и их практические функции

Плагин OpenClaw добавляет постоянную память с помощью сервера Engram.

Мобильное приложение QCAI добавляет управление шлюзом OpenClaw с нативным VPN Tailscale