Semble: Un servidor MCP local para Claude Code con una reducción del 98% en tokens

✍️ OpenClawRadar📅 Publicado: 30 de abril de 2026🔗 Source

Semble es un servidor MCP que permite a Claude Code buscar bases de código locales de manera eficiente, devolviendo solo fragmentos de código relevantes en lugar de archivos completos. Utiliza un híbrido de embeddings estáticos, BM25 y un stack de reranking optimizado para código, todo ejecutándose localmente en CPU — sin claves API, sin GPU, sin dependencias pesadas.

Instalación

Instala mediante uvx:

claude mcp add semble -s user -- uvx --from "semble[mcp]" semble

Una vez instalado, Claude Code puede buscar en cualquier repositorio — local o remoto — directamente.

Detalles clave

Reducción de tokens: Utiliza aproximadamente un 98% menos de tokens que el enfoque típico de grep+read.
Rendimiento: Indexa cualquier repositorio en unos 250ms, responde consultas en aproximadamente 1.5ms (todo en CPU).
Calidad: Alcanza un NDCG@10 de 0.854 — el 99% del mejor híbrido de transformers probado, siendo aproximadamente 200 veces más rápido.
Evaluado frente a: grepai, probe, colgrep y otros métodos existentes.
Código abierto: Disponible en GitHub bajo la organización MinishLab.

Para quién es

Desarrolladores que usan Claude Code en bases de código grandes y quieren reducir el consumo de tokens y la latencia mientras obtienen resultados de búsqueda de código de alta calidad sin llamadas a API externas.

📖 Lee la fuente completa: r/ClaudeAI

👀 Ver también

Herramientas

Agent Forge: Herramienta de Código Abierto que Estructura Pipelines Multiagente para Claude Code

Agent Forge es una habilidad de Claude Code que genera tuberías de múltiples agentes completas a partir de descripciones de casos de uso. Crea archivos de instrucciones, scripts de orquestación, directorios de flujo de datos y configuraciones de GitHub Actions basándose en patrones observados en sistemas de múltiples agentes existentes.

13 abr 2026, 19:45 UTC

OpenClawRadar

Herramientas

Agentes Subalternos Paralelos en Claude Code: Cuándo Ahorran vs. Queman Tokens

Anthropic reporta que los sistemas multiagente usan ~15× más tokens que un solo chat, pero el almacenamiento en caché de prompts ofrece un descuento del 90% en tokens. Si los subagentes ahorran o queman dinero depende de las tasas de acierto de la caché.

15 may 2026, 10:19 UTC

OpenClawRadar

Herramientas

SkyClaw Agrega Configuración de Clave API Basada en Chat Encriptado para Agentes de IA

SkyClaw implementa la ingesta de claves cifradas AES-256-GCM a través del chat, interceptando comandos de claves en la capa del sistema para que el LLM nunca vea las claves API y utilizando cifrado de clave única para que las plataformas de mensajería solo vean texto cifrado.

11 mar 2026, 07:45 UTC

OpenClawRadar

Herramientas

DeepMind DiscoRL Regla de Actualización de Metaaprendizaje Migrada de JAX a PyTorch

Un desarrollador ha adaptado la regla de actualización de metaaprendizaje DiscoRL de DeepMind de JAX a PyTorch. La implementación incluye un repositorio en GitHub con un cuaderno de Colab, una API y pesos alojados en Hugging Face.

9 mar 2026, 17:45 UTC

OpenClawRadar