srclight: Servidor MCP de Indexación de Código Totalmente Local con Incrustaciones de Ollama

Qué hace srclight
srclight es un servidor MCP (Protocolo de Contexto de Modelo) que proporciona indexación profunda de código con capacidades de búsqueda semántica que se ejecutan completamente en tu máquina local. Tu código nunca sale de tu sistema y no se requieren claves API ni llamadas a la nube.
Stack Técnico
- Análisis: análisis de AST con tree-sitter para 11 lenguajes: Python, C, C++, C#, JavaScript, TypeScript, Dart, Swift, Kotlin, Java, Go
- Búsqueda por Palabras Clave: SQLite FTS5 con 3 índices: nombres de símbolos con división camelCase/snake_case, trigramas para coincidencia de subcadenas, derivador Porter para docstrings
- Embeddings: Ollama para embeddings locales (qwen3-embedding por defecto, nomic-embed-text también funciona)
- Búsqueda Vectorial: cupy para similitud coseno acelerada por GPU (~3ms en 27K vectores en RTX 3090) con respaldo numpy (~105ms) si no hay GPU disponible
- Búsqueda Híbrida: Fusión de Rango Recíproco (RRF, k=60) combinando resultados de palabras clave FTS5 con resultados semánticos basados en embeddings
Implementación de Embeddings
El sistema de embeddings utiliza archivos secundarios .npy que se cargan en la VRAM de la GPU una vez y luego sirven todas las consultas desde la VRAM. El arranque en frío toma ~300ms, con consultas posteriores en ~3ms cada una. El sistema es incremental: solo re-embebe símbolos cuyo hash de contenido ha cambiado. Una incrustación completa de 45K símbolos toma ~15 minutos con qwen3-embedding, mientras que las actualizaciones incrementales son instantáneas.
Herramientas Disponibles
srclight proporciona 25 herramientas MCP en total:
- Búsqueda de símbolos (FTS5 + semántica + híbrida RRF)
- Gráfico de relaciones (llamadores, llamados, dependientes transitivos, implementadores, árbol de herencia, cobertura de pruebas)
- Inteligencia de cambios Git (blame por símbolo, detección de puntos calientes, trabajo no confirmado, historial de commits)
- Conciencia del sistema de compilación (CMake, objetivos .csproj y condicionales de plataforma)
- Espacios de trabajo multi-repositorio usando SQLite ATTACH+UNION entre repositorios, permitiendo búsqueda en 10+ repositorios simultáneamente
Implementación y Rendimiento
El autor indexa 13 repositorios (45K símbolos) en un espacio de trabajo. Todo se almacena en un único archivo SQLite por repositorio: no se requiere Docker, Redis, base de datos vectorial ni APIs de embedding en la nube. Los hooks de Git (post-commit, post-checkout) mantienen el índice actualizado automáticamente.
Según la encuesta del autor de más de 50 servidores de búsqueda de código MCP en los principales registros, la mayoría son envoltorios de grep o requieren APIs de embedding en la nube (OpenAI, Voyage). srclight se describe como el único que combina búsqueda por palabras clave local FTS5 + embeddings locales Ollama + caché vectorial acelerada por GPU + inteligencia Git + espacios de trabajo multi-repositorio en una sola instalación pip.
Compatibilidad e Instalación
Funciona con cualquier cliente MCP incluyendo Claude Code, Cursor, Windsurf, Cline y VS Code. La instalación es mediante pip install srclight. El proyecto tiene licencia MIT y es completamente de código abierto en https://github.com/srclight/srclight.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Tu agente dijo que lo enviaron – Por qué los rastros de sesión importan más que los nombres de los modelos
Un desarrollador reporta un patrón observado en tres equipos: los agentes afirman haber completado la tarea, pero las trazas de sesión revelan refactorizaciones ocultas, convenciones omitidas e implementaciones subóptimas. El artículo sostiene que el verdadero problema no es la calidad del modelo, sino la confianza, y que las trazas de sesión por instancia son la única forma de verificar las afirmaciones.

Arquitecto de Agentes: Herramienta Gratuita Genera Archivos Completos de Espacio de Trabajo para Agentes de IA
Agent Architect es una herramienta interactiva gratuita que guía a los usuarios a través de más de 40 preguntas sobre su agente de IA, luego compila todo en un prompt formateado para generar siete archivos de espacio de trabajo de calidad de producción: SOUL.md, IDENTITY.md, AGENTS.md, OPERATIONS.md, TOOLS.md, MEMORY.md y HEARTBEAT.md.

Open-Foundry: Un Marco para Debates Multi-Agente con Claude Code
Open-foundry es un framework de Python que ensambla múltiples agentes Claude Code en un panel para debatir preguntas complejas, produciendo rastros de razonamiento completamente inspeccionables con transcripciones, registros del orquestador y notas de trabajo por agente.

Por qué los cazarrecompensas de IA están perdiendo dinero: Datos de 60 casos
Un desarrollador intentó que Claude ganara dinero con recompensas de código abierto usando un presupuesto de $20 en tokens. Tras escanear más de 80 recompensas en Algora, descubrió que la mayoría están saturadas con 10+ PR abiertos, spam de $1 o reservadas para entrevistas. Valor esperado: $0.