Réduire l'utilisation des jetons MCP en remplaçant les serveurs par des alternatives en ligne de commande

Optimisation des tokens par réduction des serveurs MCP
Un développeur a découvert que chaque serveur MCP ajouté à sa configuration déversait l'intégralité de son schéma d'outils dans la fenêtre de contexte à chaque message, consommant 30 à 40 % de son contexte disponible. Cela le faisait atteindre les limites de contexte plus rapidement que prévu.
Remplacements spécifiques MCP vers CLI
Après avoir audité sa configuration, il a identifié plusieurs serveurs MCP ayant des équivalents CLI et a effectué ces remplacements :
agentmail mcp → agentmail cli(installé vianpm install -g agentmail-cli) - permet à Claude de gérer la boîte de réception, d'envoyer des emails et de vérifier les messages via bashgithub mcp → gh cli- en utilisant des commandes commegh issue createetgh pr listpostgres mcp → psql- en utilisant des commandes commepsql -c "select * from users"
Serveurs MCP conservés dans la configuration
Deux serveurs MCP ont été conservés car ils manquaient de bonnes alternatives CLI :
- playwright mcp - pour les tâches d'automatisation de navigateur
- memory mcp - pour la fonctionnalité de mémoire persistante
Configuration résultante et règle
Le développeur a réduit son nombre de serveurs MCP de 6 à 2 tout en conservant toutes les fonctionnalités précédentes. Il a établi une nouvelle règle : "s'il y a un CLI, sautez le MCP. N'ajoutez des MCP que pour ce qui n'a vraiment pas d'option en ligne de commande." Ce changement a donné l'impression d'une fenêtre de contexte plus grande et a réduit la fréquence à laquelle il atteignait les limites.
📖 Read the full source: r/ClaudeAI
👀 See Also

Claude Prompt pour Visualiser la Structure de la Pensée : Intention, Réalité, Écart
Un utilisateur de Reddit partage une invite de 100 mots pour Claude qui demande à l'IA de remarquer et de refléter les schémas structurels de la conversation — catégorisés en Intention (ce que vous VOULEZ), Réalité (ce qui EST) et Écart (ce qui est NON RÉSOLU) — plutôt que le contenu lui-même.

Sources de données de Claude : Quand demander des recherches web pour des informations actuelles
Claude s'appuie parfois sur des données d'entraînement internes plutôt que d'effectuer des recherches web, ce qui peut fournir des informations obsolètes. Les utilisateurs peuvent demander spécifiquement des recherches web pour obtenir des résultats plus récents.

Compte rendu terrain : Qwen 3.6 27B sur un MacBook Pro M2 (32 Go) – Très lent mais sortie intelligente
Exécuter Qwen 3.6 27B IQ4_XS sur un MacBook Pro M2 avec 32 Go de RAM donne 7,9 t/s au départ, mais descend à 3,1 t/s à 52k de contexte. La qualité du code impressionne, mais la bande passante mémoire est le goulet d'étranglement.

Modèle OpenClaw AGENTS.md pour la préparation automatisée des appels commerciaux
Un utilisateur de Reddit partage une instruction AGENTS.md pour OpenClaw qui automatise la recherche de prospects avant les appels commerciaux, en étudiant les détails de l'entreprise et les points de douleur pour envoyer un briefing 10 minutes avant les réunions.