Soyez Mon Majordome : Pipeline Multi-Agent pour la Vérification de Code IA

✍️ OpenClawRadar📅 Publié: March 14, 2026🔗 Source

Ce que fait Be My Butler

Be My Butler (BMB) est un pipeline multi-agents conçu pour résoudre un problème spécifique dans le codage assisté par IA : lorsque les agents de codage IA signalent incorrectement leur propre code comme fonctionnel. Le créateur, un ingénieur en matériaux/mécanique sans formation en programmation, a construit cela après avoir constaté que les agents Claude Code écrivaient du code qui passait les tests mais ne fonctionnait pas réellement en pratique.

Concept central

Le système met en œuvre un modèle de révision par les pairs pour le code généré par l'IA :

Un modèle écrit le code
Un modèle différent le révise sans savoir qui l'a écrit (vérification aveugle)
Un conseil inter-modèles (Claude + GPT + Gemini) vote pour déterminer s'il fonctionne réellement
Un agent analyste suit les modèles de ce qui ne fonctionne pas

Métriques de performance

D'après les tests :

L'auto-révision par agent unique détecte ~40 % des vrais problèmes
La révision aveugle inter-modèles détecte ~85 %
Surcharge de coût : 15-20 % de tokens supplémentaires

Fonctionnalités v0.2

Tableau de bord analytique pour suivre l'utilisation des tokens et les coûts
Agent analyste pour les modèles de révision de code automatisée
Agent consultant pour les décisions d'architecture
Orchestration améliorée basée sur tmux

Installation et utilisation

Entièrement open source sous licence MIT. Installation :

git clone https://github.com/project820/be-my-butler.git
cd be-my-butler && ./install.sh
bmb "build a REST API with auth"

L'outil est particulièrement utile pour les "codeurs à l'intuition" — les personnes sans expérience traditionnelle en codage qui dépendent de l'IA pour l'évaluation de la qualité du code. Lorsque vous ne pouvez pas lire le code pour repérer vous-même les problèmes, avoir plusieurs modèles qui se vérifient mutuellement fournit une vérification que les systèmes à agent unique n'offrent pas.

📖 Read the full source: r/ClaudeAI

👀 See Also

Tools

Personnaliser Claude IA pour un retour amélioré

Ajustez les paramètres de Claude IA pour éviter un accord excessif et favoriser une réflexion plus critique et des retours plus pratiques.

Feb 14, 2026, 03:45 AM UTC

OpenClawRadar

Tools

ToolLoop : Framework d'Agent Open-Source pour Outils de Style Claude avec N'importe Quel Modèle

ToolLoop est un framework Python open-source avec 11 outils pour les opérations sur fichiers, la recherche de code, l'accès au shell et des sous-agents qui fonctionne avec n'importe quel LLM via LiteLLM. Le framework de 2 700 lignes permet de changer de modèle en cours de conversation avec un contexte partagé.

Apr 20, 2026, 06:54 PM UTC

OpenClawRadar

Tools

Heartbeat-gateway : Remplacement piloté par événements pour le sondage cron dans OpenClaw

Heartbeat-gateway est un outil Python open-source qui remplace la vérification périodique basée sur cron par des événements déclenchés par webhook pour OpenClaw, réduisant les coûts d'API d'environ 86 $/mois à environ 4,50 $/mois et améliorant la latence de jusqu'à 30 minutes à moins de 2 secondes.

Mar 28, 2026, 11:45 PM UTC

OpenClawRadar

Tools

Configurations éphémères d'OpenClaw avec sandboxing réseau et démantèlement automatique

Une configuration qui démarre OpenClaw dans une VM éphémère avec une liste d'autorisation de sortie réseau, injecte des clés API dans un stockage en mémoire vive et inclut un arrêt automatique après 2 heures. Tous les appels LLM sont enregistrés dans SQLite pour relecture.

Mar 22, 2026, 01:45 AM UTC

OpenClawRadar