SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales

SourceBridge es un proyecto de código abierto que utiliza LLMs locales para construir una comprensión estructurada de bases de código. Lo apuntas a un repositorio Git y este indexa la base de código en un gráfico de símbolos que contiene archivos, funciones, clases y dependencias. La herramienta luego utiliza tu LLM para construir un árbol de comprensión jerárquico que comienza desde segmentos de código individuales y se acumula a través de archivos, paquetes y el repositorio completo.
Lo que genera
- Notas resumidas: resúmenes de múltiples niveles basados en código real
- Recorridos de código: paseos ordenados arquitectónicamente con referencias específicas a archivos/funciones
- Rutas de aprendizaje: material de incorporación estructurado pedagógicamente
- Historias de flujo de trabajo: trazas de flujo de datos a través del sistema
- Búsqueda semántica contra el gráfico del repositorio
Soporte para modelos locales
El soporte para modelos locales fue una prioridad desde el primer día. Los backends actualmente compatibles incluyen:
- Ollama — backend local principal, contra el cual el desarrollador prueba diariamente
- llama.cpp — soporte directo de llama-server, ligeramente más rápido que Ollama en pruebas
- vLLM — para servidores GPU
- LM Studio — incluyendo decodificación especulativa
- SGLang — para configuraciones multi-GPU
Todos los backends funcionan a través de la API compatible con OpenAI, por lo que cualquier cosa que use ese protocolo funciona. Los proveedores en la nube (Anthropic, OpenAI, Gemini, OpenRouter) también son compatibles para cuando deseas mayor calidad en tareas específicas.
Rendimiento del modelo
El desarrollador lo ha estado ejecutando principalmente en Qwen 3.5 35B-A3B (MoE, solo 3B parámetros activos) a través de llama.cpp en un Mac Studio. Con cuantización Q4_K_XL funciona aproximadamente a 50 tokens/segundo y produce notas resumidas y recorridos de código sólidos. Para repositorios más grandes, se ha probado Qwen 3.5 122B-A10B a través de Ollama — muestra mejor seguimiento de instrucciones pero necesita alrededor de 76GB de RAM.
Para tareas de comprensión (resumir código, construir el árbol de comprensión), los modelos de clase 32B hacen un trabajo razonable. La brecha de calidad entre modelos locales y en la nube es notable pero no es un impedimento para la mayoría de los casos de uso. Los modelos en la nube aún claramente ganan en generación de estilo informe donde necesitas que el LLM siga instrucciones de formato complejas sin bucles.
El modo de pensamiento en los modelos Qwen 3.5 está deshabilitado por defecto — desperdicia tokens en cadenas de razonamiento que no mejoran la salida de comprensión. Esto es configurable mediante variable de entorno si deseas experimentar.
Arquitectura
- Servidor API Go (indexación, autenticación, cola de trabajos, almacén de gráficos)
- Trabajador Python gRPC (llamadas LLM, pipeline de comprensión, generación de artefactos)
- Interfaz web Next.js (progreso en tiempo real, visor de markdown)
- SurrealDB (datos de gráficos, artefactos de conocimiento, estado de trabajos)
- Los tres componentes están Dockerizados, se ejecutan con
docker compose up
El trabajador maneja colas, reintentos, retrocesos y cancelaciones — así que si tu modelo local es lento o se bloquea durante la generación, el sistema se recupera elegantemente en lugar de perder el trabajo.
Comenzar
git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Edita config.toml — apunta llm.provider a tu instancia de Ollama/llama.cpp
docker compose up
Tu código nunca sale de tu máquina. La inferencia del LLM permanece local. Hay telemetría anónima opcional (solo conteo de instalaciones, deshabilita con DO_NOT_TRACK=1).
El desarrollador está buscando comentarios de personas que ejecutan modelos locales sobre qué funciona y qué no, especialmente respecto a qué modelos producen la mejor salida de comprensión, si los modelos MoE valen la compensación de RAM versus modelos densos, y cualquier problema con backends específicos.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Auto-co: Un Script de Bash de 50 Líneas Que Convierte Código de Claude en Compañías de IA Autónomas
Auto-co es un script bash de 50 líneas que envuelve la CLI de Claude Code en un bucle, permitiéndole ejecutarse de forma autónoma con 14 agentes de IA que desempeñan roles como CEO, ingeniero y crítico. Ha construido cuatro productos desde cero, incluyendo FormReply y Changelog.dev, con un costo total de $268 en más de 270 ciclos.

Presentamos Roam-Code CLI: Una alternativa más rápida y determinista para la exploración de código.
Roam-Code CLI reemplaza la fase de exploración de Claude Code con una alternativa más rápida y determinista que indexa bases de código para mejorar la eficiencia.

LocalSynapse MCP Server Permite a Claude Buscar Documentos Locales Sin Conexión
LocalSynapse es un servidor MCP que indexa y busca dentro de documentos locales (Word, Excel, PowerPoint, PDF) utilizando búsqueda semántica híbrida BM25 + IA. Todo se ejecuta localmente sin necesidad de nube ni claves API.

Manos a la obra con el modelo de Tencent: fuerte para flujos de trabajo agentivos, débil para codificación compleja
El modelo de Tencent obtiene 8/10 en tareas agentivas con bajas tasas de alucinación, pero falla en tareas de codificación complejas como los esquemas de la API de Notion. Evítalo para lógica de backend.