MCP Slim : La recherche par intégration locale pour les outils MCP réduit l'encombrement du contexte

✍️ OpenClawRadar📅 Publié: April 17, 2026🔗 Source
MCP Slim : La recherche par intégration locale pour les outils MCP réduit l'encombrement du contexte
Ad

MCP Slim est un outil proxy qui résout le problème d'encombrement contextuel de MCP en remplaçant les catalogues complets d'outils par trois méta-outils : recherche, description et appel. Au lieu de charger toutes les définitions d'outils au préalable, le LLM recherche ce dont il a besoin, réduisant ainsi l'utilisation de la fenêtre contextuelle de 96%.

Détails clés

L'outil cible spécifiquement le problème documenté d'encombrement contextuel de MCP où la connexion de quelques serveurs peut consommer plus de 55 000 tokens sur les définitions d'outils avant le premier message. Le principal différentiateur de MCP Slim par rapport à d'autres proxys comme mcp-compressor et MCProxy est son utilisation de la recherche sémantique avec un modèle d'embedding MiniLM local. Cela lui permet de trouver des outils pertinents sans chevauchement de mots-clés - par exemple, "enregistrer une note" peut trouver create_entities.

L'outil fonctionne entièrement hors ligne et ne nécessite aucune clé API. Il fonctionne avec n'importe quel client MCP stdio, y compris Claude Desktop, Cursor, Cline, Windsurf et Zed.

Ad

Installation et configuration

L'installation se fait via : npx mcp-slim init

Le dépôt GitHub est disponible à l'adresse : https://github.com/dopatools/mcp-slim

L'auteur (/u/OpportunitySpare2441) s'est proposé de répondre aux questions concernant l'architecture ou les compromis.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Atelier v0.3 ajoute des révisions ciblées de markdown avec Claude Code.
Tools

Atelier v0.3 ajoute des révisions ciblées de markdown avec Claude Code.

Atelier v0.3 est une extension gratuite pour VS Code qui vous permet de surligner des sections de documents markdown et de les envoyer à Claude Code pour révision. L'agent répond avec des modifications ciblées dans l'éditeur, et vous pouvez suivre quel retour chaque révision adresse.

OpenClawRadar
Résumé de réunion sur un GPU 6 Go : qwen3.5:0.8B fonctionne en 57s, Granite 4 350M hallucine
Tools

Résumé de réunion sur un GPU 6 Go : qwen3.5:0.8B fonctionne en 57s, Granite 4 350M hallucine

VoiceFlow v1.6.0 ajoute l'enregistrement et le résumé de réunions en local. Benchmark de modèles sub-1B sur une RTX 3060 6GB : qwen3.5:0.8B produit des résumés structurés en 57s avec 2,2 Go de VRAM, tandis que Granite 4 350M hallucine gravement.

OpenClawRadar
YourMemory : La mémoire IA à dégradation biologique atteint 59% de rappel sur LoCoMo-10
Tools

YourMemory : La mémoire IA à dégradation biologique atteint 59% de rappel sur LoCoMo-10

YourMemory offre une mémoire persistante aux agents IA en utilisant la courbe d'oubli d'Ebbinghaus et une récupération améliorée par graphe. Benchmarké à 59% Recall@5 sur LoCoMo-10, 2× mieux que Zep Cloud.

OpenClawRadar
ToolLoop : Framework d'Agent Open-Source pour Outils de Style Claude avec N'importe Quel Modèle
Tools

ToolLoop : Framework d'Agent Open-Source pour Outils de Style Claude avec N'importe Quel Modèle

ToolLoop est un framework Python open-source avec 11 outils pour les opérations sur fichiers, la recherche de code, l'accès au shell et des sous-agents qui fonctionne avec n'importe quel LLM via LiteLLM. Le framework de 2 700 lignes permet de changer de modèle en cours de conversation avec un contexte partagé.

OpenClawRadar