Будь моим дворецким: Многокомпонентный конвейер для проверки кода с помощью ИИ

✍️ OpenClawRadar📅 Опубликовано: 14 марта 2026 г.🔗 Source
Будь моим дворецким: Многокомпонентный конвейер для проверки кода с помощью ИИ
Ad

Что делает Be My Butler

Be My Butler (BMB) — это многокомпонентный конвейер, созданный для решения конкретной проблемы в ИИ-ассистированном программировании: когда ИИ-агенты ошибочно сообщают о работоспособности собственного кода. Создатель, инженер-материаловед/механик без опыта программирования, разработал эту систему после того, как столкнулся с тем, что агенты Claude Code писали код, который проходил тесты, но на практике не работал.

Основная концепция

Система реализует модель коллегиальной проверки для кода, сгенерированного ИИ:

  • Одна модель пишет код
  • Другая модель проверяет его, не зная, кто его написал (слепая верификация)
  • Межмодельный совет (Claude + GPT + Gemini) голосует, действительно ли код работает
  • Агент-аналитик отслеживает закономерности в возникающих проблемах

Показатели эффективности

По результатам тестирования:

  • Самопроверка одним агентом выявляет ~40% реальных проблем
  • Межмодельная слепая проверка выявляет ~85%
  • Накладные расходы: на 15-20% больше токенов
Ad

Возможности версии 0.2

  • Панель аналитики для отслеживания использования токенов и затрат
  • Агент-аналитик для автоматического выявления паттернов в проверке кода
  • Агент-консультант для принятия архитектурных решений
  • Улучшенная оркестрация на основе tmux

Установка и использование

Полностью открытый исходный код под лицензией MIT. Установка:

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

Инструмент особенно полезен для «виб-кодеров» — людей без традиционного опыта программирования, которые полагаются на ИИ для оценки качества кода. Когда вы не можете прочитать код и самостоятельно обнаружить проблемы, наличие нескольких моделей, проверяющих друг друга, обеспечивает верификацию, которой не хватает системам с одним агентом.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Бета-версия Claude Dispatch: советы по настройке и первые впечатления
Инструменты

Бета-версия Claude Dispatch: советы по настройке и первые впечатления

Разработчик делится опытом настройки бета-версии Dispatch на Mac Mini, подчеркивая необходимость постоянной работы, конкретных критериев успеха и агрессивных разрешений с включенным Computer Use.

OpenClawRadar
Кодграф: Предварительно индексированный граф знаний сокращает вызовы инструментов Claude/Cursor на 94%
Инструменты

Кодграф: Предварительно индексированный граф знаний сокращает вызовы инструментов Claude/Cursor на 94%

Codegraph использует предварительно проиндексированный граф знаний, содержащий связи символов, графы вызовов и структуру кода, чтобы сократить количество вызовов API-инструментов до 94% и ускорить использование примерно на 77% для агентов Claude, Cursor, Codex и OpenCode.

OpenClawRadar
Приложение для лидерства с 90+ уроками из 20+ книг работает в Claude
Инструменты

Приложение для лидерства с 90+ уроками из 20+ книг работает в Claude

Разработчик создал приложение для развития лидерских качеств, которое работает внутри Claude. Оно содержит более 90 уроков, извлечённых из более чем 20 книг по темам: лидерство, привычки, дисциплина, влияние, корпоративная культура и мышление для достижения богатства. Приложение предоставляет ежедневные уроки с конкретными действиями, отслеживание серий, ведение дневника и возможности поиска.

OpenClawRadar
OpenClaw Client добавляет отслеживание стоимости API в реальном времени, лимиты расходов и детальные настройки агентов
Инструменты

OpenClaw Client добавляет отслеживание стоимости API в реальном времени, лимиты расходов и детальные настройки агентов

В клиенте OpenClaw теперь доступен интерфейс отслеживания использования в реальном времени с круговыми индикаторами прогресса, лимитами расходов на агента, управлением подчиненными агентами, переключением навыков и сменой моделей от разных провайдеров.

OpenClawRadar