OpenClaw v2026.3.13 fügt eine pro-Agent cacheRetention-Konfiguration hinzu, um OpenAI-Tokenkosten zu senken.

Was hat sich in v2026.3.13 geändert
OpenClaw Version 2026.3.13 hat eine ordnungsgemäße Konfigurationsvalidierung für params.cacheRetention bei pro-Agent-Einträgen hinzugefügt. Dadurch können Sie die Cache-Aufbewahrung deklarativ in Ihrer openclaw.json-Konfigurationsdatei festlegen.
Das Problem mit dem Standard-Cache-Verhalten
OpenAI unterstützt eine erweiterte Prompt-Cache-Aufbewahrung (24 Stunden) über prompt_cache_retention: "24h" in ihrer API, wodurch Ihr Prompt-Präfix 24 Stunden lang zwischengespeichert bleibt, anstatt der Standard-5-10 Minuten. Zwischengespeicherte Eingabe-Tokens werden mit 50 % Rabatt abgerechnet.
Wenn Sie Agenten mit Herzschlagzyklen länger als 10 Minuten ausführen (was laut Quelle "praktisch jeder" ist), wird Ihr Cache zwischen jedem einzelnen Durchlauf vollständig kalt. Das bedeutet, Sie zahlen den vollen Preis für den gesamten Eingabekontext bei jedem Herzschlag.
Die Quelle beschreibt ein Setup mit 15 Agenten auf GPT-5.2 mit Herzschlägen alle 60-90 Minuten, bei dem jeder Herzschlag ein garantierter Kaltstart war. Der System-Prompt, Bootstrap-Kontext, HEARTBEAT.md, AGENTS.md, SOUL.md, Tool-Definitionen – alles wurde bei jedem Zyklus zum vollen Preis erneut gesendet, weil der Cache in der Lücke zwischen den Herzschlägen abgelaufen war.
Wie man es konfiguriert
Sie können jetzt die Cache-Aufbewahrung in Ihrer openclaw.json festlegen:
{
"agents": {
"list": [
{
"agentId": "my-agent",
"params": {
"cacheRetention": "long"
}
}
]
}
}Der Wert "long" wird über die pi-ai-Bibliothek auf OpenAIs prompt_cache_retention: "24h" abgebildet.
Wichtiger Hinweis: Runtime-Patch erforderlich
OpenClaws Funktion resolveCacheRetention() hat eine Schutzklausel, die standardmäßig OpenAI-Provider blockiert. Sie lässt nur Anthropic und Bedrock durch. Selbst mit gesetzter Konfiguration wird der Wert also herausgefiltert, bevor er die API erreicht.
Sie benötigen den Runtime-Patch aus Issue #27515, damit es funktioniert. Der Patch fügt OpenAI zur erlaubten Provider-Liste in der Schutzklausel hinzu. Ohne sowohl die Konfiguration ALS AUCH den Patch passiert nichts.
Der Quellenautor merkt an, dass er den Patch wochenlang angewendet hatte, aber nie den Konfigurationswert gesetzt hat – was bedeutet, dass der Patch extraParams?.cacheRetention !== void 0 überprüfte, undefined erhielt und OpenAI trotzdem blockierte. Der Patch tat ohne die Konfiguration nichts.
Potenzielle Kosteneinsparungen
Mit 15 Agenten, die Herzschläge ausführen und jeweils ~128K-170K Eingabe-Tokens pro Durchgang senden:
- Ohne 24h-Cache: 100 % der Eingabe-Tokens zum vollen Preis, bei jedem Durchgang. Der Cache stirbt in der ~60-90 min Lücke zwischen Herzschlägen.
- Mit 24h-Cache: Das stabile Präfix (System-Prompt, Agenten-Konfiguration, Tool-Definitionen – typischerweise 80-90 % der Eingabe) bleibt über Herzschläge hinweg zwischengespeichert. Diese Tokens werden zum halben Preis abgerechnet.
Bei einem System, das 15 Agenten über einen ganzen Geschäftstag hinweg ausführt, sind das Hunderte von Herzschlagzyklen pro Tag, bei denen der Großteil der Eingabe-Tokens vom vollen auf den halben Preis wechselt. Die Reduzierung der Eingabekosten summiert sich schnell.
📖 Read the full source: r/openclaw
👀 Siehe auch

8 taktische Claude-Code-Workflow-Tipps für produktionsreife Ergebnisse
Erzwinge klärende Fragen, automatische Verifizierung in To-Dos, nutze den Early Exit und setze Vision/DevTools ein, um produktionsreifen Code von Claude zu erhalten.

Fordere KI auf, ihre eigenen Begriffe aus ersten Prinzipien zu definieren für bessere Ergebnisse und nachvollziehbare Begründungen
Ein Nutzer auf r/ClaudeAI hat herausgefunden, dass das Hinzufügen einer einzigen Anweisung, undefinierte Begriffe vor der weiteren Bearbeitung auf ihre atomare Bedeutung herunterzubrechen, spezifischere Ausgaben liefert und Debugging durch eine nachvollziehbare Argumentationskette ermöglicht.

Wie ein Nicht-Entwickler einen wiederverwendbaren Claude-Workflow für das Content-Marketing von Gründern erstellte
Ein ehemaliger Redakteur einer Zeitschrift ohne Programmierkenntnisse teilt, wie er versehentlich einen wiederverwendbaren Claude-Workflow für das Content-Marketing als Solo-Gründer entwickelte: rohe Gedanken ausspucken, dann mit Claude in plattformspezifische Formate umstrukturieren.

Claude-Nutzer teilt Prompt "Verwalten Sie nicht meine Gefühle" für direktes technisches Feedback
Ein Claude-Benutzer empfiehlt, eine bestimmte Eingabeaufforderung in den Benutzereinstellungen festzulegen, um die Validierungseinleitung zu reduzieren und direkteres technisches Feedback zu erhalten. Die Eingabeaufforderung weist Claude an, diplomatische Formulierungen zu überspringen und unverblümte Kritik zu technischen und kreativen Arbeiten zu geben.