Будь моим дворецким: Многокомпонентный конвейер для проверки кода с помощью ИИ

✍️ OpenClawRadar📅 Опубликовано: 14 марта 2026 г.🔗 Source

Что делает Be My Butler

Be My Butler (BMB) — это многокомпонентный конвейер, созданный для решения конкретной проблемы в ИИ-ассистированном программировании: когда ИИ-агенты ошибочно сообщают о работоспособности собственного кода. Создатель, инженер-материаловед/механик без опыта программирования, разработал эту систему после того, как столкнулся с тем, что агенты Claude Code писали код, который проходил тесты, но на практике не работал.

Основная концепция

Система реализует модель коллегиальной проверки для кода, сгенерированного ИИ:

Одна модель пишет код
Другая модель проверяет его, не зная, кто его написал (слепая верификация)
Межмодельный совет (Claude + GPT + Gemini) голосует, действительно ли код работает
Агент-аналитик отслеживает закономерности в возникающих проблемах

Показатели эффективности

По результатам тестирования:

Самопроверка одним агентом выявляет ~40% реальных проблем
Межмодельная слепая проверка выявляет ~85%
Накладные расходы: на 15-20% больше токенов

Возможности версии 0.2

Панель аналитики для отслеживания использования токенов и затрат
Агент-аналитик для автоматического выявления паттернов в проверке кода
Агент-консультант для принятия архитектурных решений
Улучшенная оркестрация на основе tmux

Установка и использование

Полностью открытый исходный код под лицензией MIT. Установка:

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

Инструмент особенно полезен для «виб-кодеров» — людей без традиционного опыта программирования, которые полагаются на ИИ для оценки качества кода. Когда вы не можете прочитать код и самостоятельно обнаружить проблемы, наличие нескольких моделей, проверяющих друг друга, обеспечивает верификацию, которой не хватает системам с одним агентом.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Бета-версия Claude Dispatch: советы по настройке и первые впечатления

Разработчик делится опытом настройки бета-версии Dispatch на Mac Mini, подчеркивая необходимость постоянной работы, конкретных критериев успеха и агрессивных разрешений с включенным Computer Use.

2 мая 2026 г., 14:18 UTC

OpenClawRadar

Инструменты

Кодграф: Предварительно индексированный граф знаний сокращает вызовы инструментов Claude/Cursor на 94%

Codegraph использует предварительно проиндексированный граф знаний, содержащий связи символов, графы вызовов и структуру кода, чтобы сократить количество вызовов API-инструментов до 94% и ускорить использование примерно на 77% для агентов Claude, Cursor, Codex и OpenCode.

19 мая 2026 г., 20:18 UTC

OpenClawRadar

Инструменты

Приложение для лидерства с 90+ уроками из 20+ книг работает в Claude

Разработчик создал приложение для развития лидерских качеств, которое работает внутри Claude. Оно содержит более 90 уроков, извлечённых из более чем 20 книг по темам: лидерство, привычки, дисциплина, влияние, корпоративная культура и мышление для достижения богатства. Приложение предоставляет ежедневные уроки с конкретными действиями, отслеживание серий, ведение дневника и возможности поиска.

14 апр. 2026 г., 16:45 UTC

OpenClawRadar

Инструменты

OpenClaw Client добавляет отслеживание стоимости API в реальном времени, лимиты расходов и детальные настройки агентов

В клиенте OpenClaw теперь доступен интерфейс отслеживания использования в реальном времени с круговыми индикаторами прогресса, лимитами расходов на агента, управлением подчиненными агентами, переключением навыков и сменой моделей от разных провайдеров.

29 апр. 2026 г., 10:20 UTC

OpenClawRadar