SourceBridge: Open-Source-Tool zur Codebasis-Analyse mit lokalen LLMs

SourceBridge ist ein Open-Source-Projekt, das lokale LLMs nutzt, um ein strukturiertes Verständnis von Codebasen aufzubauen. Sie zeigen es auf ein Git-Repository und es indiziert die Codebase in einen Symbolgraphen, der Dateien, Funktionen, Klassen und Abhängigkeiten enthält. Das Tool verwendet dann Ihr LLM, um einen hierarchischen Verständnisbaum aufzubauen, der von einzelnen Codesegmenten ausgeht und sich über Dateien, Pakete und das gesamte Repository erstreckt.
Was es generiert
- Kurzfassungen: Mehrstufige Zusammenfassungen, die im tatsächlichen Code verankert sind
- Code-Touren: Architektonisch geordnete Rundgänge mit spezifischen Datei-/Funktionsreferenzen
- Lernpfade: Pädagogisch strukturiertes Onboarding-Material
- Workflow-Geschichten: Datenflussverfolgungen durch das System
- Semantische Suche gegen den Repository-Graphen
Unterstützung lokaler Modelle
Die Unterstützung lokaler Modelle hatte von Anfang an Priorität. Derzeit unterstützte Backends umfassen:
- Ollama — primäres lokales Backend, wogegen der Entwickler täglich testet
- llama.cpp — direkte llama-server-Unterstützung, in Tests etwas schneller als Ollama
- vLLM — für GPU-Server
- LM Studio — einschließlich spekulativer Dekodierung
- SGLang — für Multi-GPU-Setups
Alle Backends funktionieren über die OpenAI-kompatible API, sodass alles, was dieses Protokoll spricht, funktioniert. Cloud-Anbieter (Anthropic, OpenAI, Gemini, OpenRouter) werden ebenfalls unterstützt, wenn Sie höhere Qualität für bestimmte Aufgaben wünschen.
Modellleistung
Der Entwickler hat es hauptsächlich auf Qwen 3.5 35B-A3B (MoE, nur 3B aktive Parameter) über llama.cpp auf einem Mac Studio ausgeführt. Bei Q4_K_XL-Quantisierung läuft es mit etwa 50 Token/Sekunde und erzeugt solide Kurzfassungen und Code-Touren. Für größere Repositories wurde Qwen 3.5 122B-A10B über Ollama getestet — es zeigt bessere Befolgung von Anweisungen, benötigt aber etwa 76 GB RAM.
Für Verständnisaufgaben (Zusammenfassen von Code, Aufbau des Verständnisbaums) leisten 32B-Klassen-Modelle einen vernünftigen Job. Die Qualitätslücke zwischen lokalen und Cloud-Modellen ist spürbar, aber für die meisten Anwendungsfälle kein Ausschlusskriterium. Cloud-Modelle gewinnen immer noch klar bei berichtsartiger Generierung, bei der das LLM komplexe Formatierungsanweisungen ohne Schleifen befolgen muss.
Der Denkmodus in Qwen 3.5-Modellen ist standardmäßig deaktiviert — er verschwendet Token auf Argumentationsketten, die das Verständnis-Output nicht verbessern. Dies ist über eine Umgebungsvariable konfigurierbar, wenn Sie experimentieren möchten.
Architektur
- Go-API-Server (Indizierung, Authentifizierung, Job-Warteschlange, Graph-Speicher)
- Python-gRPC-Worker (LLM-Aufrufe, Verständnis-Pipeline, Artefaktgenerierung)
- Next.js-Web-UI (Echtzeit-Fortschritt, Markdown-Viewer)
- SurrealDB (Graph-Daten, Wissensartefakte, Job-Status)
- Alle drei Komponenten sind dockerisiert, laufen mit
docker compose up
Der Worker kümmert sich um Warteschlangen, Wiederholungen, Backoff und Abbruch — wenn Ihr lokales Modell also langsam ist oder während der Generierung abstürzt, erholt sich das System elegant, anstatt die Arbeit zu verlieren.
Erste Schritte
git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Bearbeiten Sie config.toml — richten Sie llm.provider auf Ihre Ollama/llama.cpp-Instanz
docker compose up
Ihr Code verlässt nie Ihren Rechner. Die LLM-Inferenz bleibt lokal. Es gibt Opt-out-anonyme Telemetrie (nur Installationszählung, deaktivieren mit DO_NOT_TRACK=1).
Der Entwickler sucht Feedback von Personen, die lokale Modelle ausführen, was funktioniert und was nicht, insbesondere welche Modelle das beste Verständnis-Output liefern, ob MoE-Modelle den RAM-Kompromiss wert sind gegenüber dichten Modellen und Probleme mit bestimmten Backends.
📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA
👀 Siehe auch

Lumia: One-Click Local AI-Begleitsystem mit dauerhaftem Speicher
Lumia ist ein modulares System, das lokal mit Ollama und lokalen Modellen läuft, um persistente KI-Begleiter mit episodischem Gedächtnis, emotionalem Gedächtnis, Überzeugungen, Wünschen, Identität, Beziehungsmodellierung und Reflexionszyklen zu erstellen.

Signet: Ein Open-Source-Lokales-First-Speichersubstrat für KI-Agenten
Signet ist ein Open-Source-Speichersubstrat für KI-Agenten, das die Speicherverwaltung außerhalb der Agentenschleife verlagert. Es bewahrt Transkripte auf, destilliert Sitzungen in strukturierten Speicher, verknüpft Entitäten in einem Graphen und injiziert Kontext, bevor Prompts beginnen.

TEMM1E v3.1.0: KI-Agent, der sich selbst durch Benutzerinteraktionen feinabstimmt
TEMM1E v3.1.0 führt Eigen-Tune ein, ein System, das LLM-Interaktionen als Trainingsdaten erfasst, die Qualität aus Nutzerverhalten bewertet und lokale Modelle via LoRA feinabstimmt – ohne zusätzliche LLM-Kosten. Getestet auf Apple M2 korrigierte es Temperaturumrechnungen von 72°F = '150°C' auf '21,2°C' nach 10 Konversationen.

Akemon: Veröffentlichen und Mieten Sie KI-Codierungs-Agenten direkt von Ihrem Laptop aus
Akemon ist ein Tool, das Entwicklern ermöglicht, ihre KI-Codierungsagenten mit einem Befehl zu veröffentlichen und die Agenten anderer mit einem weiteren Befehl einzustellen. Es funktioniert direkt vom Laptop aus über einen Relay-Tunnel, ohne dass Server benötigt werden. Es ist protokollunabhängig und unterstützt Agenten von Claude Code, Codex, Gemini, OpenCode, Cursor und Windsurf.