graphify-ts: Lokaler MCP-Server reduziert Claude Code PR-Review-Tokens von 63K auf 8,7K

Wenn du Claude Code in einer echten Codebasis verwendet hast, kennst du das Problem: Jede Frage löst 8-10 sequenzielle Tool-Aufrufe aus (glob, grep, read, read, read), um den Kontext von Grund auf neu aufzubauen. Die Eingabe-Token häufen sich, die Latenz steigt, und der Agent entdeckt jedes Mal dieselbe Struktur neu. graphify-ts ist ein kostenloser Open-Source-MCP-Server, der deinen Code vorab in einen lokalen Wissensgraphen indiziert, sodass Claude nur einen einzigen retrieve-Aufruf tätigt.
Wie es funktioniert
Zum Indexierungszeitpunkt parst graphify-ts deinen Code mit tree-sitter AST, extrahiert strukturelle Beziehungen (Dateien, Funktionen, Klassen, Aufrufe, Importe), führt Louvain-Community-Erkennung durch, um verwandte Module zu gruppieren, indiziert mit BM25 und führt optional ein Reranking mit einem lokalen ONNX-Modell durch. Der resultierende Graph wird über MCP stdio bereitgestellt – vollständig lokal, keine Daten verlassen deinen Laptop. Das Standard-Core-Profil stellt 6 Tools zur Verfügung, um den Session-Overhead niedrig zu halten (ca. 5K Token); du kannst mit GRAPHIFY_TOOL_PROFILE=full auf die volle 21-Tool-Oberfläche umschalten.
Benchmarks, die du überprüfen kannst
Das Repository enthält ein Skript verify.sh, das alle Zahlen aus festgehaltenen Beweisen ableitet. Gemessene Ergebnisse auf einer echten Produktions-Codebasis mit NestJS + Next.js (1.268 Dateien) mit Claude Opus 4.7:
- Einzelne Codeabfrage: 9 Tool-Aufrufe → 615.190 Eingabe-Token → 233.508 (2,6× weniger), Latenz 96 Sek. → 35 Sek. (2,8× schneller). Beide aus Claude's
--output-format jsonNutzungsfeld. - PR-Review mit 36 Dateien: Prompt-Token von 63.024 auf 8.690 reduziert (7,25× kleiner). Gleicher Reviewer, gleicher Diff, gleiche Review-Tiefe – beide Läufe markierten dieselben Hotspots.
- Multi-Repo-Frage über 3 Repos: Geschätzter naiver Prompt ~1,5 Mio. Token (würde in kein Fenster passen) vs. 2.800 Token mit graphify-ts. Der Autor weist darauf hin, dass dies eine strukturelle Schätzung ist, kein gesendeter Prompt.
Installation und Nutzung
npm install -g @mohammednagy/graphify-ts
cd your-project
graphify-ts generate .
graphify-ts claude installFunktioniert auch mit Cursor, Copilot, Gemini CLI, Aider, OpenCode via <agent> install.
Nachteile, die du kennen solltest
- Kaltstart-Kosten: Die erste Sitzung kostet aufgrund des Tool-Schema-Overheads (~5K Token) etwa 13% mehr als die Baseline ohne Graph. Mehrere Fragen in einer Sitzung amortisieren dies.
- Sprachunterstützung: Die tiefe Extraktion funktioniert am besten bei JS/TS mit Framework-spezifischen Pässen (Express, NestJS, Next.js, Redux Toolkit, React Router). Python/Ruby/Go/Java/Rust verwenden das einfache tree-sitter AST. C/Kotlin/C#/Scala/PHP/Swift/Zig verwenden einen generischen strukturellen Extraktor.
- Grenzen: Dies ist eine strukturelle Karte für einen Agenten, keine vollständige Programmanalyse-Datenbank. Stark metaprogrammierte Routen fallen auf das Basis-AST zurück.
Der Autor sucht aktiv nach Gegenbeispielen – Repos, bei denen strukturelles Slicing versagt. MIT-lizenziert, erfordert Node 20+.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

Ein 6.400 Dollar lokaler LLM-Server: TCO-Vergleich vs. API-Kosten
Ein Entwickler teilt eine detaillierte Gesamtkostenanalyse für einen lokalen Server mit 4x MI100, der llama.cpp nutzt, im Vergleich zu API-Äquivalenten wie OpenAI und Z.AI-Coding-Pläne.

Spore Agent Arena: Wettbewerbsplattform für KI-Agenten-Tests sucht Testteilnehmer
Die Arena-Funktion von Spore Agent ermöglicht es KI-Agenten, in 36 verschiedenen Spieltypen anzutreten, darunter Code-Debugging, Mathe-Rätsel und Systemdesign-Herausforderungen. Die Plattform hat derzeit 42 laufende Herausforderungen, 15 registrierte Agenten und bietet Cog-Tokens als Belohnungen an.

Open-Source-Tool misst Autonomie von KI-Codierungsagenten mit lokaler Datenanalyse
Codelens-AI ist ein Open-Source-CLI-Tool, das Claude-Code-Sitzungsdateien zusammen mit dem Git-Verlauf analysiert, um Autonomie-Metriken wie Autopilot-Verhältnis und Self-Heal-Score zu berechnen. Das Tool läuft lokal ohne Einrichtung mit npx claude-roi und behält alle Daten auf Ihrem Rechner.

llama.cpp上的Qwen 3.6 27B通过MTP推测解码达到2.5倍速度
Ein Reddit-Bericht meldet 2,5-fach schnellere Inferenz bei Qwen 3.6 27B mittels MTP spekulativem Decoding mit einem benutzerdefinierten llama.cpp-PR, was 28 tok/s auf einem Mac M2 Max 96GB erreicht. Enthält vorkonvertierte GGUF-Quantisierungen und korrigierte Chat-Templates.