SourceBridge: Open-Source-Tool für Codeanalyse mit lokalen LLMs

SourceBridge ist ein Open-Source-Projekt, das lokale LLMs nutzt, um ein strukturiertes Verständnis von Codebasen aufzubauen. Sie zeigen es auf ein Git-Repository und es indiziert die Codebase in einen Symbolgraphen, der Dateien, Funktionen, Klassen und Abhängigkeiten enthält. Das Tool verwendet dann Ihr LLM, um einen hierarchischen Verständnisbaum aufzubauen, der von einzelnen Codesegmenten ausgeht und sich über Dateien, Pakete und das gesamte Repository erstreckt.

Was es generiert

Kurzfassungen: Mehrstufige Zusammenfassungen, die im tatsächlichen Code verankert sind
Code-Touren: Architektonisch geordnete Rundgänge mit spezifischen Datei-/Funktionsreferenzen
Lernpfade: Pädagogisch strukturiertes Onboarding-Material
Workflow-Geschichten: Datenflussverfolgungen durch das System
Semantische Suche gegen den Repository-Graphen

Unterstützung lokaler Modelle

Die Unterstützung lokaler Modelle hatte von Anfang an Priorität. Derzeit unterstützte Backends umfassen:

Ollama — primäres lokales Backend, wogegen der Entwickler täglich testet
llama.cpp — direkte llama-server-Unterstützung, in Tests etwas schneller als Ollama
vLLM — für GPU-Server
LM Studio — einschließlich spekulativer Dekodierung
SGLang — für Multi-GPU-Setups

Alle Backends funktionieren über die OpenAI-kompatible API, sodass alles, was dieses Protokoll spricht, funktioniert. Cloud-Anbieter (Anthropic, OpenAI, Gemini, OpenRouter) werden ebenfalls unterstützt, wenn Sie höhere Qualität für bestimmte Aufgaben wünschen.

Modellleistung

Der Entwickler hat es hauptsächlich auf Qwen 3.5 35B-A3B (MoE, nur 3B aktive Parameter) über llama.cpp auf einem Mac Studio ausgeführt. Bei Q4_K_XL-Quantisierung läuft es mit etwa 50 Token/Sekunde und erzeugt solide Kurzfassungen und Code-Touren. Für größere Repositories wurde Qwen 3.5 122B-A10B über Ollama getestet — es zeigt bessere Befolgung von Anweisungen, benötigt aber etwa 76 GB RAM.

Für Verständnisaufgaben (Zusammenfassen von Code, Aufbau des Verständnisbaums) leisten 32B-Klassen-Modelle einen vernünftigen Job. Die Qualitätslücke zwischen lokalen und Cloud-Modellen ist spürbar, aber für die meisten Anwendungsfälle kein Ausschlusskriterium. Cloud-Modelle gewinnen immer noch klar bei berichtsartiger Generierung, bei der das LLM komplexe Formatierungsanweisungen ohne Schleifen befolgen muss.

Der Denkmodus in Qwen 3.5-Modellen ist standardmäßig deaktiviert — er verschwendet Token auf Argumentationsketten, die das Verständnis-Output nicht verbessern. Dies ist über eine Umgebungsvariable konfigurierbar, wenn Sie experimentieren möchten.

Architektur

Go-API-Server (Indizierung, Authentifizierung, Job-Warteschlange, Graph-Speicher)
Python-gRPC-Worker (LLM-Aufrufe, Verständnis-Pipeline, Artefaktgenerierung)
Next.js-Web-UI (Echtzeit-Fortschritt, Markdown-Viewer)
SurrealDB (Graph-Daten, Wissensartefakte, Job-Status)
Alle drei Komponenten sind dockerisiert, laufen mit docker compose up

Der Worker kümmert sich um Warteschlangen, Wiederholungen, Backoff und Abbruch — wenn Ihr lokales Modell also langsam ist oder während der Generierung abstürzt, erholt sich das System elegant, anstatt die Arbeit zu verlieren.

Erste Schritte

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Bearbeiten Sie config.toml — richten Sie llm.provider auf Ihre Ollama/llama.cpp-Instanz
docker compose up

Ihr Code verlässt nie Ihren Rechner. Die LLM-Inferenz bleibt lokal. Es gibt Opt-out-anonyme Telemetrie (nur Installationszählung, deaktivieren mit DO_NOT_TRACK=1).

Der Entwickler sucht Feedback von Personen, die lokale Modelle ausführen, was funktioniert und was nicht, insbesondere welche Modelle das beste Verständnis-Output liefern, ob MoE-Modelle den RAM-Kompromiss wert sind gegenüber dichten Modellen und Probleme mit bestimmten Backends.

📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA