SourceBridge: Análisis de código con LLMs locales y código abierto

SourceBridge es un proyecto de código abierto que utiliza LLMs locales para construir una comprensión estructurada de bases de código. Lo apuntas a un repositorio Git y este indexa la base de código en un gráfico de símbolos que contiene archivos, funciones, clases y dependencias. La herramienta luego utiliza tu LLM para construir un árbol de comprensión jerárquico que comienza desde segmentos de código individuales y se acumula a través de archivos, paquetes y el repositorio completo.

Lo que genera

Notas resumidas: resúmenes de múltiples niveles basados en código real
Recorridos de código: paseos ordenados arquitectónicamente con referencias específicas a archivos/funciones
Rutas de aprendizaje: material de incorporación estructurado pedagógicamente
Historias de flujo de trabajo: trazas de flujo de datos a través del sistema
Búsqueda semántica contra el gráfico del repositorio

Soporte para modelos locales

El soporte para modelos locales fue una prioridad desde el primer día. Los backends actualmente compatibles incluyen:

Ollama — backend local principal, contra el cual el desarrollador prueba diariamente
llama.cpp — soporte directo de llama-server, ligeramente más rápido que Ollama en pruebas
vLLM — para servidores GPU
LM Studio — incluyendo decodificación especulativa
SGLang — para configuraciones multi-GPU

Todos los backends funcionan a través de la API compatible con OpenAI, por lo que cualquier cosa que use ese protocolo funciona. Los proveedores en la nube (Anthropic, OpenAI, Gemini, OpenRouter) también son compatibles para cuando deseas mayor calidad en tareas específicas.

Rendimiento del modelo

El desarrollador lo ha estado ejecutando principalmente en Qwen 3.5 35B-A3B (MoE, solo 3B parámetros activos) a través de llama.cpp en un Mac Studio. Con cuantización Q4_K_XL funciona aproximadamente a 50 tokens/segundo y produce notas resumidas y recorridos de código sólidos. Para repositorios más grandes, se ha probado Qwen 3.5 122B-A10B a través de Ollama — muestra mejor seguimiento de instrucciones pero necesita alrededor de 76GB de RAM.

Para tareas de comprensión (resumir código, construir el árbol de comprensión), los modelos de clase 32B hacen un trabajo razonable. La brecha de calidad entre modelos locales y en la nube es notable pero no es un impedimento para la mayoría de los casos de uso. Los modelos en la nube aún claramente ganan en generación de estilo informe donde necesitas que el LLM siga instrucciones de formato complejas sin bucles.

El modo de pensamiento en los modelos Qwen 3.5 está deshabilitado por defecto — desperdicia tokens en cadenas de razonamiento que no mejoran la salida de comprensión. Esto es configurable mediante variable de entorno si deseas experimentar.

Arquitectura

Servidor API Go (indexación, autenticación, cola de trabajos, almacén de gráficos)
Trabajador Python gRPC (llamadas LLM, pipeline de comprensión, generación de artefactos)
Interfaz web Next.js (progreso en tiempo real, visor de markdown)
SurrealDB (datos de gráficos, artefactos de conocimiento, estado de trabajos)
Los tres componentes están Dockerizados, se ejecutan con docker compose up

El trabajador maneja colas, reintentos, retrocesos y cancelaciones — así que si tu modelo local es lento o se bloquea durante la generación, el sistema se recupera elegantemente en lugar de perder el trabajo.

Comenzar

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Edita config.toml — apunta llm.provider a tu instancia de Ollama/llama.cpp
docker compose up

Tu código nunca sale de tu máquina. La inferencia del LLM permanece local. Hay telemetría anónima opcional (solo conteo de instalaciones, deshabilita con DO_NOT_TRACK=1).

El desarrollador está buscando comentarios de personas que ejecutan modelos locales sobre qué funciona y qué no, especialmente respecto a qué modelos producen la mejor salida de comprensión, si los modelos MoE valen la compensación de RAM versus modelos densos, y cualquier problema con backends específicos.

📖 Leer la fuente completa: r/LocalLLaMA

SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales

Lo que genera

Soporte para modelos locales

Rendimiento del modelo

Arquitectura

Comenzar

👀 Ver también

Auto-co: Un Script de Bash de 50 Líneas Que Convierte Código de Claude en Compañías de IA Autónomas

Presentamos Roam-Code CLI: Una alternativa más rápida y determinista para la exploración de código.

LocalSynapse MCP Server Permite a Claude Buscar Documentos Locales Sin Conexión

Manos a la obra con el modelo de Tencent: fuerte para flujos de trabajo agentivos, débil para codificación compleja