Brainstorm MCP Server Permet à Claude de Consulter D'autres LLM pour de Meilleures Réponses

Un développeur a créé un serveur MCP appelé "brainstorm-mcp" qui donne à Claude Code une capacité de "téléphoner à un ami", lui permettant de consulter d'autres modèles d'IA avant de fournir des réponses. Cette approche répond aux situations où la perspective d'un seul modèle pourrait être insuffisante pour des décisions techniques complexes.
Fonctionnement
Lorsque vous demandez à Claude Code de réfléchir à un problème, il ne se contente pas de transmettre votre question à d'autres modèles. Au lieu de cela, il initie un débat en plusieurs tours où :
- Claude lit les réponses de GPT et DeepSeek
- Il exprime son désaccord là où il pense qu'ils ont tort
- Tous les modèles affinent leurs positions au fil des tours
- Les autres modèles voient les réponses de Claude et ajustent les leurs
Exemple : Conception d'un outil de revue de code par IA
La source fournit un exemple concret du processus de débat :
- GPT-5.2 : A proposé un système d'entreprise avec base de données graphique Neo4j, politiques OPA, Kafka, raisonnement LLM en plusieurs passes
- DeepSeek : A visé encore plus grand — CodeLlama 70B affiné, GNN personnalisés, Pinecone
- Claude : "Cela devrait être un pipeline, pas un monolithe. Gardez la pile simple. Utilisez pgvector plutôt que Pinecone. Livrez d'abord la revue sémantique, ajoutez l'apprentissage d'équipe dans la v2."
Au deuxième tour, les deux autres modèles se sont ajustés : GPT-5.2 a accepté pgvector, et DeepSeek a abandonné les modèles personnalisés. Les trois ont convergé vers FastAPI + Postgres + tree-sitter + LLM hébergé.
L'ensemble du processus a pris 75 secondes et a coûté 0,07 $.
Installation et configuration
Pour l'utiliser avec Claude Code, ajoutez ce qui suit à votre fichier .mcp.json :
{
"mcpServers": {
"brainstorm": {
"command": "npx",
"args": ["-y", "brainstorm-mcp"],
"env": {
"OPENAI_API_KEY": "sk-...",
"DEEPSEEK_API_KEY": "sk-..."
}
}
}
}
Puis dites simplement à Claude : "Réfléchis à la meilleure approche pour [votre problème]"
Compatibilité
L'outil fonctionne avec OpenAI, DeepSeek, Groq, Mistral, Ollama — essentiellement toute API compatible avec OpenAI.
Ressources
- Sortie complète du débat : GitHub Gist
- Dépôt GitHub : spranab/brainstorm-mcp
- npm :
npx brainstorm-mcp
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Claudebin : Exportez et partagez vos sessions de code Claude
Claudebin vous permet d'exporter des sessions entières de Claude Code, les rendant partageables et reprises via une seule URL.

Script et Processus de Fusion de Modèles GGUF pour les Variantes Qwen3.5-35B
Un utilisateur de Reddit a partagé un script Python pour fusionner des fichiers de modèles GGUF avec une perte minimale, combinant spécifiquement le modèle Qwen3.5-35B-A3B-Uncensored de HauhauCS avec la version Claude-4.6-Opus-Reasoning-Distilled de samuelcardillo. Le script fonctionne sur Google Colab Free Tier et inclut le support de la quantification via llama-quantize.

Deblank : Outil pour Supprimer le Formatage du Code afin de Réduire les Tokens des LLM
Deblank est un outil open-source qui supprime la mise en forme du code (indentation, espaces, sauts de ligne) avant de l'envoyer aux LLM, réduisant les tokens d'environ 30 % pour Java/C++ et d'environ 9 % pour Python, avec une latence d'environ 76 ms. Il prend en charge Python, Java, C/C++, C#, JS/TS et Go.

RTX 5060 Ti 16GB : Benchmarks des LLM locaux : Les modèles 30B restent en tête pour le codage
Les benchmarks sur une RTX 5060 Ti 16GB montrent que le modèle Unsloth Qwen3-Coder-30B UD-Q3_K_XL atteint 76,3 tok/s sur Ubuntu avec un score de qualité de 8,14, ce qui en fait le modèle de codage recommandé par défaut. Le modèle Unsloth Qwen3.5-35B UD-Q2_K_XL atteint 80,1 tok/s mais avec des scores de qualité inférieurs.