Prompt-Caching-MCP-Plugin reduziert automatisch die Claude-API-Kosten, indem es stabilen Kontext identifiziert.

Prompt-Caching ist ein MCP-Plugin, das die Claude-API-Kosten automatisch reduziert, indem es Anthropics Caching-Funktion nutzt. Bei der Verwendung von Claude Code oder Cursor/Windsurf/Zed mit der Anthropic-API wird typischerweise bei jeder Runde der gesamte Kontext von Grund auf neu gesendet, was bedeutet, dass Tausende von Tokens während langer Debugging-Sitzungen wiederholt zum vollen Preis abgerechnet werden.
So funktioniert es
Anthropic bietet eine Caching-Funktion, die wiederholte Lesevorgänge mit 0,1× statt 1× Kosten ermöglicht, dies erfordert jedoch eine manuelle Markierung dessen, was zwischengespeichert werden soll. Das Prompt-Caching-Plugin läuft im Hintergrund, identifiziert stabile Teile Ihres Kontexts (Systemprompts, Werkzeugdefinitionen, große Dateilesevorgänge) und markiert sie automatisch vor jedem API-Aufruf.
Leistungsergebnisse
- 20-Runden-Fehlerbehebung: 85% günstiger
- 15-Runden-Refactoring: 80% günstiger
- 40-Runden-Codingsitzung: 92% günstiger
Installation
Für Claude-Code-Benutzer:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Für Cursor/Windsurf/Zed:
npm install -g prompt-caching-mcp
Richten Sie dann Ihre MCP-Konfiguration darauf aus.
Das Werkzeug ist unter der MIT-Lizenz quelloffen und kostenlos verfügbar. Das Repository befindet sich unter https://github.com/flightlesstux/prompt-caching.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

PageAgent: Browser-AI-Agent, der innerhalb von Webseiten mit Ollama-Unterstützung läuft
PageAgent ist eine JavaScript-Bibliothek, die KI-Agenten direkt innerhalb von Webseiten ausführt und dabei den Live-DOM als Text liest, anstatt Screenshots zu verwenden. Es funktioniert mit jedem OpenAI-kompatiblen Endpunkt, einschließlich Ollama, und ermöglicht lokale LLM-Aufrufe direkt aus dem Browser.

Dirac: Open-Source-Agent erreicht mit 65,2 % Platz 1 bei TerminalBench, günstiger und offen
Dirac, ein Open-Source-Coding-Agent, erreichte auf dem TerminalBench 2.0 für gemini-3-flash-preview einen Wert von 65,2 % und übertraf damit Googles Basislinie (47,6 %) sowie den führenden Closed-Source-Agenten Junie CLI (64,3 %). Zudem senkt er die API-Kosten um 64,8 % im Vergleich zu Mitbewerbern.

Hybride Suche mit RRF verbessert KI-Gedächtnissystem im Vergleich zu reiner Vektorsuche
Ein Open-Source-AI-Gedächtnissystem mit PostgreSQL und pgvector stellte fest, dass reine Vektorsuche für exakte Übereinstimmungen unzureichend ist, fügte daher Volltextsuche hinzu und fusionierte Ergebnisse mittels Reciprocal Rank Fusion (RRF) mit k=60 sowie Abfrageanreicherung via Tokenizer.

Agent-Xray: Open-Source-Tool zum Debuggen von KI-Agent-Fehlern aus Trace-Logs
Agent-Xray ist ein unter MIT-Lizenz stehendes Open-Source-Tool, das AI-Agenten-Trace-Protokolle analysiert, um Fehler in Kategorien wie Spin, Tool-Bug und Early-Abort zu klassifizieren, und enthält einen Enforcement-Modus, um Korrekturen gegen adversarische Herausforderungen zu testen.