srclight: Servidor MCP de Indexación Local con Ollama

Qué hace srclight

srclight es un servidor MCP (Protocolo de Contexto de Modelo) que proporciona indexación profunda de código con capacidades de búsqueda semántica que se ejecutan completamente en tu máquina local. Tu código nunca sale de tu sistema y no se requieren claves API ni llamadas a la nube.

Stack Técnico

Análisis: análisis de AST con tree-sitter para 11 lenguajes: Python, C, C++, C#, JavaScript, TypeScript, Dart, Swift, Kotlin, Java, Go
Búsqueda por Palabras Clave: SQLite FTS5 con 3 índices: nombres de símbolos con división camelCase/snake_case, trigramas para coincidencia de subcadenas, derivador Porter para docstrings
Embeddings: Ollama para embeddings locales (qwen3-embedding por defecto, nomic-embed-text también funciona)
Búsqueda Vectorial: cupy para similitud coseno acelerada por GPU (~3ms en 27K vectores en RTX 3090) con respaldo numpy (~105ms) si no hay GPU disponible
Búsqueda Híbrida: Fusión de Rango Recíproco (RRF, k=60) combinando resultados de palabras clave FTS5 con resultados semánticos basados en embeddings

Implementación de Embeddings

El sistema de embeddings utiliza archivos secundarios .npy que se cargan en la VRAM de la GPU una vez y luego sirven todas las consultas desde la VRAM. El arranque en frío toma ~300ms, con consultas posteriores en ~3ms cada una. El sistema es incremental: solo re-embebe símbolos cuyo hash de contenido ha cambiado. Una incrustación completa de 45K símbolos toma ~15 minutos con qwen3-embedding, mientras que las actualizaciones incrementales son instantáneas.

Herramientas Disponibles

srclight proporciona 25 herramientas MCP en total:

Búsqueda de símbolos (FTS5 + semántica + híbrida RRF)
Gráfico de relaciones (llamadores, llamados, dependientes transitivos, implementadores, árbol de herencia, cobertura de pruebas)
Inteligencia de cambios Git (blame por símbolo, detección de puntos calientes, trabajo no confirmado, historial de commits)
Conciencia del sistema de compilación (CMake, objetivos .csproj y condicionales de plataforma)
Espacios de trabajo multi-repositorio usando SQLite ATTACH+UNION entre repositorios, permitiendo búsqueda en 10+ repositorios simultáneamente

Implementación y Rendimiento

El autor indexa 13 repositorios (45K símbolos) en un espacio de trabajo. Todo se almacena en un único archivo SQLite por repositorio: no se requiere Docker, Redis, base de datos vectorial ni APIs de embedding en la nube. Los hooks de Git (post-commit, post-checkout) mantienen el índice actualizado automáticamente.

Según la encuesta del autor de más de 50 servidores de búsqueda de código MCP en los principales registros, la mayoría son envoltorios de grep o requieren APIs de embedding en la nube (OpenAI, Voyage). srclight se describe como el único que combina búsqueda por palabras clave local FTS5 + embeddings locales Ollama + caché vectorial acelerada por GPU + inteligencia Git + espacios de trabajo multi-repositorio en una sola instalación pip.

Compatibilidad e Instalación

Funciona con cualquier cliente MCP incluyendo Claude Code, Cursor, Windsurf, Cline y VS Code. La instalación es mediante pip install srclight. El proyecto tiene licencia MIT y es completamente de código abierto en https://github.com/srclight/srclight.

📖 Leer la fuente completa: r/LocalLLaMA

srclight: Servidor MCP de Indexación de Código Totalmente Local con Incrustaciones de Ollama

Qué hace srclight

Stack Técnico

Implementación de Embeddings

Herramientas Disponibles

Implementación y Rendimiento

Compatibilidad e Instalación

👀 Ver también

Context-Kit: Herramienta de Código Abierto para la Configuración de Asistentes de IA

Pneuma: Un Entorno de Escritorio Generado por IA Donde el Software se Materializa a Partir de Descripciones

Explorando LiveDocs: Un Cuaderno de Análisis de Datos Nativo de IA

mindpm: Un Servidor MCP Gratuito para Memoria de Proyecto Persistente con Claude