Seien Sie mein Butler: Multi-Agenten-Pipeline zur Überprüfung von KI-Code

✍️ OpenClawRadar📅 Veröffentlicht: 14. März 2026🔗 Source
Seien Sie mein Butler: Multi-Agenten-Pipeline zur Überprüfung von KI-Code
Ad

Was Be My Butler tut

Be My Butler (BMB) ist eine Multi-Agent-Pipeline, die ein spezifisches Problem beim KI-gestützten Programmieren löst: wenn KI-Coding-Agenten ihren eigenen Code fälschlicherweise als funktionierend melden. Der Entwickler, ein Werkstoff-/Maschinenbauingenieur ohne Programmierhintergrund, baute dies, nachdem er erlebt hatte, dass Claude-Code-Agenten Code schrieben, der Tests bestand, aber in der Praxis nicht wirklich funktionierte.

Kernkonzept

Das System implementiert ein Peer-Review-Modell für KI-generierten Code:

  • Ein Modell schreibt den Code
  • Ein anderes Modell überprüft ihn, ohne zu wissen, wer ihn geschrieben hat (blinde Verifizierung)
  • Ein Cross-Model-Rat (Claude + GPT + Gemini) stimmt darüber ab, ob er tatsächlich funktioniert
  • Ein Analysten-Agent verfolgt Muster bei Fehlern

Leistungsmetriken

Aus Tests:

  • Einzelagenten-Selbstüberprüfung erkennt ~40 % der echten Probleme
  • Cross-Model-Blinüberprüfung erkennt ~85 %
  • Kostenmehraufwand: 15–20 % mehr Tokens
Ad

v0.2-Funktionen

  • Analytics-Dashboard zur Verfolgung von Token-Nutzung und Kosten
  • Analysten-Agent für automatisierte Code-Review-Muster
  • Berater-Agent für Architekturentscheidungen
  • Verbesserte tmux-basierte Orchestrierung

Installation und Nutzung

Vollständig Open Source unter MIT-Lizenz. Installation:

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

Das Tool ist besonders nützlich für "Vibe-Coder" – Menschen ohne traditionelle Programmiererfahrung, die auf KI für die Code-Qualitätsbewertung angewiesen sind. Wenn man Code nicht selbst lesen kann, um Probleme zu erkennen, bietet die gegenseitige Überprüfung durch mehrere Modelle eine Verifizierung, die Einzelagenten-Systemen fehlt.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch