Бернштейн: Оркестратор, подобный Kubernetes, для ИИ-агентов программирования с верификацией и политиками моделей

Bernstein — это оркестратор для ИИ-агентов программирования, который создатель описывает как «Kubernetes для агентов программирования». В отличие от более простых инструментов, запускающих агентов в параллельных рабочих деревьях, Bernstein решает то, что разработчик называет «остальными 95%» проблемы.
Ключевые особенности
Система включает несколько критически важных компонентов:
- Проверка: Компонент «уборщик» независимо проверяет выходные данные агентов после каждой задачи. Он запускает тесты, проверяет различия и анализирует вывод, потому что «агенты лгут» — они могут утверждать, что тесты пройдены, когда это не так, или говорить, что файлы зафиксированы, хотя это не было сделано.
- Движок политик моделей: Предоставляет списки разрешений/запретов для каждого провайдера, ограничения на резидентность данных, предпочтительную маршрутизацию и потолки затрат. Создатель сравнивает это с «сетевыми политиками K8s, но для провайдеров LLM».
- Детерминированное планирование: Использует чистый Python для планирования вместо LLM, создавая детерминированный поток управления с нулевым расходом токенов LLM на координацию. Эпсилон-жадный бандит со временем обучается маршрутизации.
- Агентно-независимый дизайн: Включает 13 адаптеров для Claude Code, Codex, Gemini CLI, Cursor, Qwen, Aider, Amp, Roo Code, Goose, Kilo, Kiro, OpenCode и универсальных агентов. Claude Code имеет наиболее глубокую интеграцию.
- Функции масштабирования: При объёме более 500K строк и ~5000 тестов Bernstein включает автоматические выключатели, обнаружение аномалий затрат, обнаружение циклов, обнаружение взаимоблокировок, сканирование на наличие персональных данных, HMAC-цепочки аудиторских журналов, прогрессивные разрешения и карантин для подозрительного вывода.
- Саморазвитие: Может развивать себя с помощью
bernstein --evolve.
Технические детали
Создатель отмечает, что запуск агентов в рабочих деревьях — это «привет, мир в этой области» и что большинство фреймворков для мультиагентных систем используют LLM для планирования других LLM, что «медленно, дорого и недетерминировано». Подход Bernstein использует чистый Python для детерминированного потока управления.
Проект был протестирован в масштабе с более чем 500K строк кода и примерно 5000 тестов. Разработчик создал такие функции, как автоматические выключатели и обнаружение аномалий, потому что «вещи ломались, и это были исправления».
Создатель — единственный разработчик из Израиля, который упоминает, что «строил под ракетами (буквально)» и что проект перерос его, и он ищет участников.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Клод Код Карма: Локальная панель мониторинга для сессий Claude Code
Claude Code Karma — это открытая локальная панель мониторинга, которая анализирует JSONL-файлы из ~/.claude/ для визуализации данных сессий Claude Code, отслеживания использования инструментов и мониторинга скрытых сбоев. Построенная на FastAPI, Svelte-Kit 2, Svelte 5 и SQLite, она предоставляет полные временные линии сессий и отслеживание в реальном времени.

Argus: Расширение VS Code для отладки затрат и поведения сеансов Claude Code
Разработчик создал Argus — расширение для VS Code, которое парсит JSONL-транскрипты Claude Code в timeline в реальном времени с разбивкой токенов/стоимости на каждый шаг, коэффициентом попадания в кеш и пометками циклов повторных попыток, дублирующихся чтений и перегрузки контекста.

Signet: Открытая платформа локального хранения данных для ИИ-агентов
Signet — это открытая платформа памяти для ИИ-агентов, которая выносит обработку памяти за пределы цикла агента. Она сохраняет транскрипты, преобразует сессии в структурированную память, связывает сущности в граф и внедряет контекст до начала промптов.

Клод-Контроль: Мобильное Удаленное Управление для Сессий Клод Кода
Claude-control — это инструмент с открытым исходным кодом, который позволяет управлять сессиями Claude Code с телефона через HTTPS и WebSocket. Он запускает Claude Code в реальном PTY внутри tmux, обнаруживает запросы разрешений и отправляет push-уведомления с кнопками «Разрешить»/«Запретить».