OpenClaw v2026.3.13: CacheRetention senkt Tokenkosten um 90%

Was hat sich in v2026.3.13 geändert

OpenClaw Version 2026.3.13 hat eine ordnungsgemäße Konfigurationsvalidierung für params.cacheRetention bei pro-Agent-Einträgen hinzugefügt. Dadurch können Sie die Cache-Aufbewahrung deklarativ in Ihrer openclaw.json-Konfigurationsdatei festlegen.

Das Problem mit dem Standard-Cache-Verhalten

OpenAI unterstützt eine erweiterte Prompt-Cache-Aufbewahrung (24 Stunden) über prompt_cache_retention: "24h" in ihrer API, wodurch Ihr Prompt-Präfix 24 Stunden lang zwischengespeichert bleibt, anstatt der Standard-5-10 Minuten. Zwischengespeicherte Eingabe-Tokens werden mit 50 % Rabatt abgerechnet.

Wenn Sie Agenten mit Herzschlagzyklen länger als 10 Minuten ausführen (was laut Quelle "praktisch jeder" ist), wird Ihr Cache zwischen jedem einzelnen Durchlauf vollständig kalt. Das bedeutet, Sie zahlen den vollen Preis für den gesamten Eingabekontext bei jedem Herzschlag.

Die Quelle beschreibt ein Setup mit 15 Agenten auf GPT-5.2 mit Herzschlägen alle 60-90 Minuten, bei dem jeder Herzschlag ein garantierter Kaltstart war. Der System-Prompt, Bootstrap-Kontext, HEARTBEAT.md, AGENTS.md, SOUL.md, Tool-Definitionen – alles wurde bei jedem Zyklus zum vollen Preis erneut gesendet, weil der Cache in der Lücke zwischen den Herzschlägen abgelaufen war.

Wie man es konfiguriert

Sie können jetzt die Cache-Aufbewahrung in Ihrer openclaw.json festlegen:

{
  "agents": {
    "list": [
      {
        "agentId": "my-agent",
        "params": {
          "cacheRetention": "long"
        }
      }
    ]
  }
}

Der Wert "long" wird über die pi-ai-Bibliothek auf OpenAIs prompt_cache_retention: "24h" abgebildet.

Wichtiger Hinweis: Runtime-Patch erforderlich

OpenClaws Funktion resolveCacheRetention() hat eine Schutzklausel, die standardmäßig OpenAI-Provider blockiert. Sie lässt nur Anthropic und Bedrock durch. Selbst mit gesetzter Konfiguration wird der Wert also herausgefiltert, bevor er die API erreicht.

Sie benötigen den Runtime-Patch aus Issue #27515, damit es funktioniert. Der Patch fügt OpenAI zur erlaubten Provider-Liste in der Schutzklausel hinzu. Ohne sowohl die Konfiguration ALS AUCH den Patch passiert nichts.

Der Quellenautor merkt an, dass er den Patch wochenlang angewendet hatte, aber nie den Konfigurationswert gesetzt hat – was bedeutet, dass der Patch extraParams?.cacheRetention !== void 0 überprüfte, undefined erhielt und OpenAI trotzdem blockierte. Der Patch tat ohne die Konfiguration nichts.

Potenzielle Kosteneinsparungen

Mit 15 Agenten, die Herzschläge ausführen und jeweils ~128K-170K Eingabe-Tokens pro Durchgang senden:

Ohne 24h-Cache: 100 % der Eingabe-Tokens zum vollen Preis, bei jedem Durchgang. Der Cache stirbt in der ~60-90 min Lücke zwischen Herzschlägen.
Mit 24h-Cache: Das stabile Präfix (System-Prompt, Agenten-Konfiguration, Tool-Definitionen – typischerweise 80-90 % der Eingabe) bleibt über Herzschläge hinweg zwischengespeichert. Diese Tokens werden zum halben Preis abgerechnet.

Bei einem System, das 15 Agenten über einen ganzen Geschäftstag hinweg ausführt, sind das Hunderte von Herzschlagzyklen pro Tag, bei denen der Großteil der Eingabe-Tokens vom vollen auf den halben Preis wechselt. Die Reduzierung der Eingabekosten summiert sich schnell.

📖 Read the full source: r/openclaw