SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales

✍️ OpenClawRadar📅 Publicado: 21 de abril de 2026🔗 Source
SourceBridge: Herramienta de código abierto para análisis de bases de código utilizando LLMs locales
Ad

SourceBridge es un proyecto de código abierto que utiliza LLMs locales para construir una comprensión estructurada de bases de código. Lo apuntas a un repositorio Git y este indexa la base de código en un gráfico de símbolos que contiene archivos, funciones, clases y dependencias. La herramienta luego utiliza tu LLM para construir un árbol de comprensión jerárquico que comienza desde segmentos de código individuales y se acumula a través de archivos, paquetes y el repositorio completo.

Lo que genera

  • Notas resumidas: resúmenes de múltiples niveles basados en código real
  • Recorridos de código: paseos ordenados arquitectónicamente con referencias específicas a archivos/funciones
  • Rutas de aprendizaje: material de incorporación estructurado pedagógicamente
  • Historias de flujo de trabajo: trazas de flujo de datos a través del sistema
  • Búsqueda semántica contra el gráfico del repositorio

Soporte para modelos locales

El soporte para modelos locales fue una prioridad desde el primer día. Los backends actualmente compatibles incluyen:

  • Ollama — backend local principal, contra el cual el desarrollador prueba diariamente
  • llama.cpp — soporte directo de llama-server, ligeramente más rápido que Ollama en pruebas
  • vLLM — para servidores GPU
  • LM Studio — incluyendo decodificación especulativa
  • SGLang — para configuraciones multi-GPU

Todos los backends funcionan a través de la API compatible con OpenAI, por lo que cualquier cosa que use ese protocolo funciona. Los proveedores en la nube (Anthropic, OpenAI, Gemini, OpenRouter) también son compatibles para cuando deseas mayor calidad en tareas específicas.

Ad

Rendimiento del modelo

El desarrollador lo ha estado ejecutando principalmente en Qwen 3.5 35B-A3B (MoE, solo 3B parámetros activos) a través de llama.cpp en un Mac Studio. Con cuantización Q4_K_XL funciona aproximadamente a 50 tokens/segundo y produce notas resumidas y recorridos de código sólidos. Para repositorios más grandes, se ha probado Qwen 3.5 122B-A10B a través de Ollama — muestra mejor seguimiento de instrucciones pero necesita alrededor de 76GB de RAM.

Para tareas de comprensión (resumir código, construir el árbol de comprensión), los modelos de clase 32B hacen un trabajo razonable. La brecha de calidad entre modelos locales y en la nube es notable pero no es un impedimento para la mayoría de los casos de uso. Los modelos en la nube aún claramente ganan en generación de estilo informe donde necesitas que el LLM siga instrucciones de formato complejas sin bucles.

El modo de pensamiento en los modelos Qwen 3.5 está deshabilitado por defecto — desperdicia tokens en cadenas de razonamiento que no mejoran la salida de comprensión. Esto es configurable mediante variable de entorno si deseas experimentar.

Arquitectura

  • Servidor API Go (indexación, autenticación, cola de trabajos, almacén de gráficos)
  • Trabajador Python gRPC (llamadas LLM, pipeline de comprensión, generación de artefactos)
  • Interfaz web Next.js (progreso en tiempo real, visor de markdown)
  • SurrealDB (datos de gráficos, artefactos de conocimiento, estado de trabajos)
  • Los tres componentes están Dockerizados, se ejecutan con docker compose up

El trabajador maneja colas, reintentos, retrocesos y cancelaciones — así que si tu modelo local es lento o se bloquea durante la generación, el sistema se recupera elegantemente en lugar de perder el trabajo.

Comenzar

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Edita config.toml — apunta llm.provider a tu instancia de Ollama/llama.cpp
docker compose up

Tu código nunca sale de tu máquina. La inferencia del LLM permanece local. Hay telemetría anónima opcional (solo conteo de instalaciones, deshabilita con DO_NOT_TRACK=1).

El desarrollador está buscando comentarios de personas que ejecutan modelos locales sobre qué funciona y qué no, especialmente respecto a qué modelos producen la mejor salida de comprensión, si los modelos MoE valen la compensación de RAM versus modelos densos, y cualquier problema con backends específicos.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Auto-co: Un Script de Bash de 50 Líneas Que Convierte Código de Claude en Compañías de IA Autónomas
Herramientas

Auto-co: Un Script de Bash de 50 Líneas Que Convierte Código de Claude en Compañías de IA Autónomas

Auto-co es un script bash de 50 líneas que envuelve la CLI de Claude Code en un bucle, permitiéndole ejecutarse de forma autónoma con 14 agentes de IA que desempeñan roles como CEO, ingeniero y crítico. Ha construido cuatro productos desde cero, incluyendo FormReply y Changelog.dev, con un costo total de $268 en más de 270 ciclos.

OpenClawRadar
Presentamos Roam-Code CLI: Una alternativa más rápida y determinista para la exploración de código.
Herramientas

Presentamos Roam-Code CLI: Una alternativa más rápida y determinista para la exploración de código.

Roam-Code CLI reemplaza la fase de exploración de Claude Code con una alternativa más rápida y determinista que indexa bases de código para mejorar la eficiencia.

OpenClawRadar
LocalSynapse MCP Server Permite a Claude Buscar Documentos Locales Sin Conexión
Herramientas

LocalSynapse MCP Server Permite a Claude Buscar Documentos Locales Sin Conexión

LocalSynapse es un servidor MCP que indexa y busca dentro de documentos locales (Word, Excel, PowerPoint, PDF) utilizando búsqueda semántica híbrida BM25 + IA. Todo se ejecuta localmente sin necesidad de nube ni claves API.

OpenClawRadar
Manos a la obra con el modelo de Tencent: fuerte para flujos de trabajo agentivos, débil para codificación compleja
Herramientas

Manos a la obra con el modelo de Tencent: fuerte para flujos de trabajo agentivos, débil para codificación compleja

El modelo de Tencent obtiene 8/10 en tareas agentivas con bajas tasas de alucinación, pero falla en tareas de codificación complejas como los esquemas de la API de Notion. Evítalo para lógica de backend.

OpenClawRadar