Prompt-Caching-MCP-Plugin reduziert automatisch die Claude-API-Kosten, indem es stabilen Kontext identifiziert.

✍️ OpenClawRadar📅 Veröffentlicht: 13. März 2026🔗 Source

Prompt-Caching ist ein MCP-Plugin, das die Claude-API-Kosten automatisch reduziert, indem es Anthropics Caching-Funktion nutzt. Bei der Verwendung von Claude Code oder Cursor/Windsurf/Zed mit der Anthropic-API wird typischerweise bei jeder Runde der gesamte Kontext von Grund auf neu gesendet, was bedeutet, dass Tausende von Tokens während langer Debugging-Sitzungen wiederholt zum vollen Preis abgerechnet werden.

So funktioniert es

Anthropic bietet eine Caching-Funktion, die wiederholte Lesevorgänge mit 0,1× statt 1× Kosten ermöglicht, dies erfordert jedoch eine manuelle Markierung dessen, was zwischengespeichert werden soll. Das Prompt-Caching-Plugin läuft im Hintergrund, identifiziert stabile Teile Ihres Kontexts (Systemprompts, Werkzeugdefinitionen, große Dateilesevorgänge) und markiert sie automatisch vor jedem API-Aufruf.

Leistungsergebnisse

20-Runden-Fehlerbehebung: 85% günstiger
15-Runden-Refactoring: 80% günstiger
40-Runden-Codingsitzung: 92% günstiger

Installation

Für Claude-Code-Benutzer:

/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis

Für Cursor/Windsurf/Zed:

npm install -g prompt-caching-mcp

Richten Sie dann Ihre MCP-Konfiguration darauf aus.

Das Werkzeug ist unter der MIT-Lizenz quelloffen und kostenlos verfügbar. Das Repository befindet sich unter https://github.com/flightlesstux/prompt-caching.

📖 Read the full source: r/ClaudeAI

👀 Siehe auch

Werkzeuge

PageAgent: Browser-AI-Agent, der innerhalb von Webseiten mit Ollama-Unterstützung läuft

PageAgent ist eine JavaScript-Bibliothek, die KI-Agenten direkt innerhalb von Webseiten ausführt und dabei den Live-DOM als Text liest, anstatt Screenshots zu verwenden. Es funktioniert mit jedem OpenAI-kompatiblen Endpunkt, einschließlich Ollama, und ermöglicht lokale LLM-Aufrufe direkt aus dem Browser.

28. Feb. 2026, 18:45 UTC

OpenClawRadar

Werkzeuge

Dirac: Open-Source-Agent erreicht mit 65,2 % Platz 1 bei TerminalBench, günstiger und offen

Dirac, ein Open-Source-Coding-Agent, erreichte auf dem TerminalBench 2.0 für gemini-3-flash-preview einen Wert von 65,2 % und übertraf damit Googles Basislinie (47,6 %) sowie den führenden Closed-Source-Agenten Junie CLI (64,3 %). Zudem senkt er die API-Kosten um 64,8 % im Vergleich zu Mitbewerbern.

27. Apr. 2026, 14:16 UTC

OpenClawRadar

Werkzeuge

Hybride Suche mit RRF verbessert KI-Gedächtnissystem im Vergleich zu reiner Vektorsuche

Ein Open-Source-AI-Gedächtnissystem mit PostgreSQL und pgvector stellte fest, dass reine Vektorsuche für exakte Übereinstimmungen unzureichend ist, fügte daher Volltextsuche hinzu und fusionierte Ergebnisse mittels Reciprocal Rank Fusion (RRF) mit k=60 sowie Abfrageanreicherung via Tokenizer.

15. Apr. 2026, 13:23 UTC

OpenClawRadar

Werkzeuge

Agent-Xray: Open-Source-Tool zum Debuggen von KI-Agent-Fehlern aus Trace-Logs

Agent-Xray ist ein unter MIT-Lizenz stehendes Open-Source-Tool, das AI-Agenten-Trace-Protokolle analysiert, um Fehler in Kategorien wie Spin, Tool-Bug und Early-Abort zu klassifizieren, und enthält einen Enforcement-Modus, um Korrekturen gegen adversarische Herausforderungen zu testen.

15. Apr. 2026, 13:45 UTC

OpenClawRadar