SourceBridge: Open-Source-Tool zur Codebasis-Analyse mit lokalen LLMs

✍️ OpenClawRadar📅 Veröffentlicht: 21. April 2026🔗 Source
SourceBridge: Open-Source-Tool zur Codebasis-Analyse mit lokalen LLMs
Ad

SourceBridge ist ein Open-Source-Projekt, das lokale LLMs nutzt, um ein strukturiertes Verständnis von Codebasen aufzubauen. Sie zeigen es auf ein Git-Repository und es indiziert die Codebase in einen Symbolgraphen, der Dateien, Funktionen, Klassen und Abhängigkeiten enthält. Das Tool verwendet dann Ihr LLM, um einen hierarchischen Verständnisbaum aufzubauen, der von einzelnen Codesegmenten ausgeht und sich über Dateien, Pakete und das gesamte Repository erstreckt.

Was es generiert

  • Kurzfassungen: Mehrstufige Zusammenfassungen, die im tatsächlichen Code verankert sind
  • Code-Touren: Architektonisch geordnete Rundgänge mit spezifischen Datei-/Funktionsreferenzen
  • Lernpfade: Pädagogisch strukturiertes Onboarding-Material
  • Workflow-Geschichten: Datenflussverfolgungen durch das System
  • Semantische Suche gegen den Repository-Graphen

Unterstützung lokaler Modelle

Die Unterstützung lokaler Modelle hatte von Anfang an Priorität. Derzeit unterstützte Backends umfassen:

  • Ollama — primäres lokales Backend, wogegen der Entwickler täglich testet
  • llama.cpp — direkte llama-server-Unterstützung, in Tests etwas schneller als Ollama
  • vLLM — für GPU-Server
  • LM Studio — einschließlich spekulativer Dekodierung
  • SGLang — für Multi-GPU-Setups

Alle Backends funktionieren über die OpenAI-kompatible API, sodass alles, was dieses Protokoll spricht, funktioniert. Cloud-Anbieter (Anthropic, OpenAI, Gemini, OpenRouter) werden ebenfalls unterstützt, wenn Sie höhere Qualität für bestimmte Aufgaben wünschen.

Ad

Modellleistung

Der Entwickler hat es hauptsächlich auf Qwen 3.5 35B-A3B (MoE, nur 3B aktive Parameter) über llama.cpp auf einem Mac Studio ausgeführt. Bei Q4_K_XL-Quantisierung läuft es mit etwa 50 Token/Sekunde und erzeugt solide Kurzfassungen und Code-Touren. Für größere Repositories wurde Qwen 3.5 122B-A10B über Ollama getestet — es zeigt bessere Befolgung von Anweisungen, benötigt aber etwa 76 GB RAM.

Für Verständnisaufgaben (Zusammenfassen von Code, Aufbau des Verständnisbaums) leisten 32B-Klassen-Modelle einen vernünftigen Job. Die Qualitätslücke zwischen lokalen und Cloud-Modellen ist spürbar, aber für die meisten Anwendungsfälle kein Ausschlusskriterium. Cloud-Modelle gewinnen immer noch klar bei berichtsartiger Generierung, bei der das LLM komplexe Formatierungsanweisungen ohne Schleifen befolgen muss.

Der Denkmodus in Qwen 3.5-Modellen ist standardmäßig deaktiviert — er verschwendet Token auf Argumentationsketten, die das Verständnis-Output nicht verbessern. Dies ist über eine Umgebungsvariable konfigurierbar, wenn Sie experimentieren möchten.

Architektur

  • Go-API-Server (Indizierung, Authentifizierung, Job-Warteschlange, Graph-Speicher)
  • Python-gRPC-Worker (LLM-Aufrufe, Verständnis-Pipeline, Artefaktgenerierung)
  • Next.js-Web-UI (Echtzeit-Fortschritt, Markdown-Viewer)
  • SurrealDB (Graph-Daten, Wissensartefakte, Job-Status)
  • Alle drei Komponenten sind dockerisiert, laufen mit docker compose up

Der Worker kümmert sich um Warteschlangen, Wiederholungen, Backoff und Abbruch — wenn Ihr lokales Modell also langsam ist oder während der Generierung abstürzt, erholt sich das System elegant, anstatt die Arbeit zu verlieren.

Erste Schritte

git clone https://github.com/sourcebridge-ai/sourcebridge.git
cd sourcebridge
# Bearbeiten Sie config.toml — richten Sie llm.provider auf Ihre Ollama/llama.cpp-Instanz
docker compose up

Ihr Code verlässt nie Ihren Rechner. Die LLM-Inferenz bleibt lokal. Es gibt Opt-out-anonyme Telemetrie (nur Installationszählung, deaktivieren mit DO_NOT_TRACK=1).

Der Entwickler sucht Feedback von Personen, die lokale Modelle ausführen, was funktioniert und was nicht, insbesondere welche Modelle das beste Verständnis-Output liefern, ob MoE-Modelle den RAM-Kompromiss wert sind gegenüber dichten Modellen und Probleme mit bestimmten Backends.

📖 Lesen Sie die vollständige Quelle: r/LocalLLaMA

Ad

👀 Siehe auch

Lumia: One-Click Local AI-Begleitsystem mit dauerhaftem Speicher
Werkzeuge

Lumia: One-Click Local AI-Begleitsystem mit dauerhaftem Speicher

Lumia ist ein modulares System, das lokal mit Ollama und lokalen Modellen läuft, um persistente KI-Begleiter mit episodischem Gedächtnis, emotionalem Gedächtnis, Überzeugungen, Wünschen, Identität, Beziehungsmodellierung und Reflexionszyklen zu erstellen.

OpenClawRadar
Signet: Ein Open-Source-Lokales-First-Speichersubstrat für KI-Agenten
Werkzeuge

Signet: Ein Open-Source-Lokales-First-Speichersubstrat für KI-Agenten

Signet ist ein Open-Source-Speichersubstrat für KI-Agenten, das die Speicherverwaltung außerhalb der Agentenschleife verlagert. Es bewahrt Transkripte auf, destilliert Sitzungen in strukturierten Speicher, verknüpft Entitäten in einem Graphen und injiziert Kontext, bevor Prompts beginnen.

OpenClawRadar
TEMM1E v3.1.0: KI-Agent, der sich selbst durch Benutzerinteraktionen feinabstimmt
Werkzeuge

TEMM1E v3.1.0: KI-Agent, der sich selbst durch Benutzerinteraktionen feinabstimmt

TEMM1E v3.1.0 führt Eigen-Tune ein, ein System, das LLM-Interaktionen als Trainingsdaten erfasst, die Qualität aus Nutzerverhalten bewertet und lokale Modelle via LoRA feinabstimmt – ohne zusätzliche LLM-Kosten. Getestet auf Apple M2 korrigierte es Temperaturumrechnungen von 72°F = '150°C' auf '21,2°C' nach 10 Konversationen.

OpenClawRadar
Akemon: Veröffentlichen und Mieten Sie KI-Codierungs-Agenten direkt von Ihrem Laptop aus
Werkzeuge

Akemon: Veröffentlichen und Mieten Sie KI-Codierungs-Agenten direkt von Ihrem Laptop aus

Akemon ist ein Tool, das Entwicklern ermöglicht, ihre KI-Codierungsagenten mit einem Befehl zu veröffentlichen und die Agenten anderer mit einem weiteren Befehl einzustellen. Es funktioniert direkt vom Laptop aus über einen Relay-Tunnel, ohne dass Server benötigt werden. Es ist protokollunabhängig und unterstützt Agenten von Claude Code, Codex, Gemini, OpenCode, Cursor und Windsurf.

OpenClawRadar