Messung des Claude Code MCP-Stacks: Cache-Freundlichkeit vs. Byte-Ersparnis und eine 2-Zeilen-Korrektur für den Prompt-Cache

✍️ OpenClawRadar📅 Veröffentlicht: 7. Juni 2026🔗 Source
Messung des Claude Code MCP-Stacks: Cache-Freundlichkeit vs. Byte-Ersparnis und eine 2-Zeilen-Korrektur für den Prompt-Cache
Ad

Bei der Optimierung eines Claude Code MCP-Stacks konzentriert man sich leicht auf eine einzige Metrik: Byte-Einsparungen. Aber Greg Shevchenkos neue Analyse zeigt, dass ein eindimensionaler Benchmark ein System empfehlen kann, das in der Produktion streng schlechter abschneidet. Die fehlende Achse: Cache-Freundlichkeit, d. h., ob dieselbe Eingabe über mehrere Durchläufe hinweg byteidentische Ausgaben erzeugt, sodass Anthropics Prompt-Cache trifft.

Shevchenkos größter Byte-Sparer – ein Retrieval-MCP, das den Kontext um 60–70 % reduzierte – hat tatsächlich den 5-Minuten-TTL-Prompt-Cache bei jedem Aufruf ausgehebelt. Zwei Durchläufe derselben Abfrage erzeugten unterschiedliche Bytes, weil die Ausgabereihenfolge von rg --files-with-matches durch eine Map-Einfügungssequenz in den endgültigen Kontext durchsickerte. Der Fix bestand aus zwei Zeilen: Sortieren der rg-Treffer vor dem Kürzen und Sortieren der Map-Einträge nach Pfad. Nach der Änderung blieben die Byte-Einsparungen unverändert, aber cache_friendly_score stieg von ~0 % auf 100 %.

Ad

Was der Harness misst

Shevchenko veröffentlichte einen Open-Source-Benchmark-Harness (nur Standardbibliothek Python, offline), der Folgendes misst:

  • Mittleres Verhältnis + CV über N≥5 Durchläufe pro Fixture → Byte-Einsparungsachse
  • Prüfung auf eindeutige MD5-Anzahl == 1 → Cache-Freundlichkeitsachse (0–100 %)
  • 12-Anti-Pattern-Audit für Tool-Definitionen (DSA-Referenz)

Jeder Kompressor als (str) -> str kann eingesteckt werden. Der Harness verwendet Cluster-Bootstrap-KIs, Wilson-KIs, Vorregistrierung und Cohen's κ mit echten Daten.

Übersicht öffentlicher Alternativen

Shevchenko untersuchte öffentliche Dokumentationen zu: Cursor Codebase Index, Sourcegraph Cody, Aider Repo-Map, Microsoft LLMLingua/LLMLingua-2, Firecrawl/Jina Reader, RouteLLM/Martian (Stand Mai 2026). Keine offenbarte Cache-Freundlichkeitsmetriken.

Einschränkungen

Er vermutete, dass die Vorbereitungsschicht nachfolgende Cache-Treffer bei nachfolgenden Runden auslöst, aber es wurde keine Signifikanz erreicht (Welch p=0,32, Cohen's d≈0,18, N=137). Cohen's κ zwischen zwei Gutachtern lag bei 0,5955 (mäßig, unter dem Schwellenwert von 0,7), wobei 4 von 5 Meinungsverschiedenheiten auf eine einzelne mehrdeutige Aufgabe entfielen – ein Fix der Spezifikation würde κ auf ~0,83 heben.

Der Harness steht unter der MIT-Lizenz. Wenn Sie einen Claude Code MCP-Stack betreiben, ist die Messung von cache_friendly_score jetzt ein konkretes, umsetzbares Ziel.

📖 Vollständige Quelle lesen: r/ClaudeAI

Ad

👀 Siehe auch

Datenanalyst baut Prompt-Kalibrierungstool mit Claude, ohne Vorerfahrung im Frontend
Werkzeuge

Datenanalyst baut Prompt-Kalibrierungstool mit Claude, ohne Vorerfahrung im Frontend

Ein Datenanalyst ohne HTML-, CSS- oder JavaScript-Erfahrung entwickelte Prompt Calibrator, ein clientseitiges Webtool, das KI-Prompts über ein Formular mit vier Feldern und vier Modi strukturiert. Das Tool wurde mit Claude als Code-Review-Partner entwickelt und wird auf GitHub Pages gehostet.

OpenClawRadar
Engram v1.0.0: Persistenter Speicher für lokale LLMs über ein Wissensnetz
Werkzeuge

Engram v1.0.0: Persistenter Speicher für lokale LLMs über ein Wissensnetz

Engram ist eine einzelne Binärdatei, die lokalen LLMs durch ein Wissensgraphensystem persistente Erinnerung bietet. Es enthält einen MCP-Server für die Integration mit Claude Code, Cursor und Windsurf, speichert alle Daten in einer einzigen .brain-Datei und läuft vollständig offline.

OpenClawRadar
SwarmClaw Dashboard fügt OpenClaw eine Orchestrierungsebene hinzu
Werkzeuge

SwarmClaw Dashboard fügt OpenClaw eine Orchestrierungsebene hinzu

SwarmClaw ist ein selbst gehostetes Dashboard, das OpenClaw umhüllt und die Bereitstellung und Verwaltung mehrerer Instanzen mit Gateway-Steuerungen, Konfigurationsreparatur, Remote-Historiensynchronisierung und Live-Ausführungsgenehmigung ermöglicht. Es unterstützt OpenClaw-Plugins und SKILL.md-Dateien und verbindet sich mit 14 weiteren KI-Anbietern.

OpenClawRadar
KI-Framework für Teammitglieder in Slack, vollständig über Claude Code betrieben
Werkzeuge

KI-Framework für Teammitglieder in Slack, vollständig über Claude Code betrieben

ginnie-agents ist ein Open-Source-Framework zum Betreiben autonomer KI-Agenten mit Slack-Identitäten, dreistufigem Gedächtnis, Cron-Routinen und Arbeitszeiten – alles konfiguriert und betrieben über Claude Code. Erfordert Claude Code Max, Docker, Node 22+ und einen Slack-Workspace mit Berechtigung zur App-Erstellung.

OpenClawRadar