MCP Slim: Búsqueda de Incrustaciones Locales para Herramientas MCP Reduce la Saturación de Contexto

MCP Slim es una herramienta proxy que aborda el problema de inflación de contexto de MCP al reemplazar los catálogos completos de herramientas con tres meta-herramientas: buscar, describir y llamar. En lugar de cargar todas las definiciones de herramientas de antemano, el LLM busca lo que necesita, reduciendo el uso de la ventana de contexto en un 96%.
Detalles Clave
La herramienta se enfoca específicamente en el problema documentado de inflación de contexto de MCP, donde conectar algunos servidores puede consumir más de 55,000 tokens en definiciones de herramientas antes del primer mensaje. El principal diferenciador de MCP Slim frente a otros proxies como mcp-compressor y MCProxy es su uso de búsqueda semántica con un modelo de incrustación MiniLM local. Esto le permite encontrar herramientas relevantes sin superposición de palabras clave; por ejemplo, "guardar una nota" puede encontrar create_entities.
La herramienta funciona completamente sin conexión y no requiere claves API. Funciona con cualquier cliente MCP stdio, incluyendo Claude Desktop, Cursor, Cline, Windsurf y Zed.
Instalación y Configuración
La instalación se realiza mediante: npx mcp-slim init
El repositorio de GitHub está disponible en: https://github.com/dopatools/mcp-slim
El autor (/u/OpportunitySpare2441) se ha ofrecido a responder preguntas sobre la arquitectura o compensaciones.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

OmniCoder-9B ajustado muestra un rendimiento sólido para la codificación de agentes en sistemas con 8 GB de VRAM.
Un usuario de Reddit probó OmniCoder-9B, un ajuste fino de Qwen3.5-9B en trazas Opus, con OpenCode y reportó velocidades de más de 40 tokens por segundo usando cuantización Q4_K_M GGUF con una longitud de contexto de 100k en un sistema con 8GB de VRAM.

El desarrollador de OpenClaw construye el complemento de memoria cognitiva Kumiho para la colaboración persistente de agentes.
Un desarrollador creó Kumiho, un sistema de memoria cognitiva de IA respaldado por un grafo de conocimiento, para abordar la falta de memoria de OpenClaw entre sesiones. El complemento openclaw-kumiho se conecta a las conversaciones para recordar el contexto, capturar resúmenes estructurados y mantener versiones de las salidas creativas.

Monitor de Tokens de IA: Herramienta para macOS Rastrea el Uso y Costo Local de Claude
Un desarrollador creó AI Token Monitor, una aplicación para la barra de menú de macOS que lee archivos de sesión locales de Claude para rastrear el uso de tokens, la distribución de modelos y los costos equivalentes sin claves API. La herramienta de código abierto reveló 6.5 millones de tokens ($4,924 al precio de la API) en 35 días en el caso de un usuario.

Claude Code Plugin de Grado de Producción v3.0 Lanzado: Pipeline de Desarrollo de Software Autónomo
El Plugin de Grado de Producción v3.0 para Claude Code ya está disponible como software gratuito de código abierto bajo licencia MIT. El plugin crea una canalización de desarrollo completa desde los requisitos hasta la implementación con 13 habilidades de IA que actúan como un equipo de ingeniería.