Semble: Un servidor MCP local para Claude Code con una reducción del 98% en tokens

Semble es un servidor MCP que permite a Claude Code buscar bases de código locales de manera eficiente, devolviendo solo fragmentos de código relevantes en lugar de archivos completos. Utiliza un híbrido de embeddings estáticos, BM25 y un stack de reranking optimizado para código, todo ejecutándose localmente en CPU — sin claves API, sin GPU, sin dependencias pesadas.
Instalación
Instala mediante uvx:
claude mcp add semble -s user -- uvx --from "semble[mcp]" semble
Una vez instalado, Claude Code puede buscar en cualquier repositorio — local o remoto — directamente.
Detalles clave
- Reducción de tokens: Utiliza aproximadamente un 98% menos de tokens que el enfoque típico de grep+read.
- Rendimiento: Indexa cualquier repositorio en unos 250ms, responde consultas en aproximadamente 1.5ms (todo en CPU).
- Calidad: Alcanza un NDCG@10 de 0.854 — el 99% del mejor híbrido de transformers probado, siendo aproximadamente 200 veces más rápido.
- Evaluado frente a: grepai, probe, colgrep y otros métodos existentes.
- Código abierto: Disponible en GitHub bajo la organización MinishLab.
Para quién es
Desarrolladores que usan Claude Code en bases de código grandes y quieren reducir el consumo de tokens y la latencia mientras obtienen resultados de búsqueda de código de alta calidad sin llamadas a API externas.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

Agent Forge: Herramienta de Código Abierto que Estructura Pipelines Multiagente para Claude Code
Agent Forge es una habilidad de Claude Code que genera tuberías de múltiples agentes completas a partir de descripciones de casos de uso. Crea archivos de instrucciones, scripts de orquestación, directorios de flujo de datos y configuraciones de GitHub Actions basándose en patrones observados en sistemas de múltiples agentes existentes.

Agentes Subalternos Paralelos en Claude Code: Cuándo Ahorran vs. Queman Tokens
Anthropic reporta que los sistemas multiagente usan ~15× más tokens que un solo chat, pero el almacenamiento en caché de prompts ofrece un descuento del 90% en tokens. Si los subagentes ahorran o queman dinero depende de las tasas de acierto de la caché.

SkyClaw Agrega Configuración de Clave API Basada en Chat Encriptado para Agentes de IA
SkyClaw implementa la ingesta de claves cifradas AES-256-GCM a través del chat, interceptando comandos de claves en la capa del sistema para que el LLM nunca vea las claves API y utilizando cifrado de clave única para que las plataformas de mensajería solo vean texto cifrado.

DeepMind DiscoRL Regla de Actualización de Metaaprendizaje Migrada de JAX a PyTorch
Un desarrollador ha adaptado la regla de actualización de metaaprendizaje DiscoRL de DeepMind de JAX a PyTorch. La implementación incluye un repositorio en GitHub con un cuaderno de Colab, una API y pesos alojados en Hugging Face.