Claude Prompt Cache-Diagnose: Statistik-Thread zeigt 98,9 % Cache-Lesequote

✍️ OpenClawRadar📅 Veröffentlicht: 20. Mai 2026🔗 Source

Vor zwei Tagen hat Anthropic die Prompt-Cache-Diagnosefunktion in der Claude Console veröffentlicht. Sie hilft Entwicklern zu verstehen, warum eine Anfrage den Cache verfehlt und Kosten zu senken. Ein Entwickler (u/samuelroy_) teilte seine Statistiken in einem Community-Thread, um Muster zu finden und die Cache-Leistung insgesamt zu verbessern.

Wichtige Statistiken aus der Quelle

Gesamte Cache-Lesequote: 98,9 %
80 % der Cache-Fehlschläge sind auf messages changed zurückzuführen.
Schreibamortisation für Sonnet: 3,69x

Der Entwickler merkte an, dass sein Projekt-Harness so konzipiert ist, dass nur Nachrichten an den Verlauf angehängt werden, was die hohe Fehlerrate durch messages changed überraschend macht. Die wahrscheinliche Erklärung ist, dass Benutzer Unterhaltungen abzweigen, was die Nachrichtenkette verändert.

Was das bedeutet

Prompt-Caching reduziert Kosten und Latenz. Mit einer Lesequote von 98,9 % ist der Entwickler bereits effizient, aber die Diagnosedaten zeigen einen klaren Verbesserungsbereich: die Reduzierung unnötiger Nachrichtenänderungen. Wenn Sie ähnliche Muster sehen, könnte die Prüfung, wie Unterhaltungen abgezweigt oder bearbeitet werden, die Cache-Trefferquote erhöhen.

Zur Referenz: Die Schreibamortisation (3,69x für Sonnet) gibt an, wie oft ein Cache-Eintrag im Verhältnis zu Lesezugriffen geschrieben wird. Ein niedrigerer Wert ist besser.

Erstanbieter-Analysen wie diese sind ein Schritt nach vorne für die Optimierung der KI-API-Kosten. Andere Anbieter werden voraussichtlich folgen.

📖 Lesen Sie die vollständige Quelle: r/ClaudeAI

👀 Siehe auch

Nachrichten

Infomaniak überträgt Mehrheitsstimmrechte an Stiftung, um die Schweizer Cloud-Unabhängigkeit zu sichern

Infomaniak sichert seine langfristige Unabhängigkeit, indem es die Mehrheitsstimmrechte an eine Schweizer Stiftung des öffentlichen Interesses übertragen hat. Eine Übernahme ist ohne Zustimmung der Stiftung nicht möglich.

21. Mai 2026, 00:17 UTC

OpenClawRadar

Nachrichten

Erhöhte Fehler bei Claude Opus 4.7: Statusupdate und was zu erwarten ist

Claude Opus 4.7 hat seit dem 19.05.2026 um 15:21 Uhr UTC vermehrt Fehler. Weitere Informationen und Updates finden Sie auf status.claude.com.

19. Mai 2026, 16:15 UTC

OpenClawRadar

Nachrichten

Feinabgestimmte Qwen3-Kleinstmodelle übertreffen Spitzen-LLMs bei spezifischen Aufgaben zu geringeren Kosten

Destillierte Qwen3-Modelle (0,6B bis 8B Parameter) übertrafen oder erreichten Spitzen-API-Modelle wie GPT-5, Gemini und Claude bei 6 von 9 Aufgaben, einschließlich Funktionsaufrufen und Text2SQL, mit Kosten von nur 3 US-Dollar pro Million Anfragen gegenüber 378 US-Dollar für vergleichbare Leistung.

9. März 2026, 15:45 UTC

OpenClawRadar

Nachrichten

Anthropic verlagert die Hintergrundautomatisierung von Claude Code in ein separates SDK-Guthaben-Bucket und unterbricht damit Agent-Workflows

Ab dem 15. Juni werden claude -p, Agent SDK-Nutzung, Claude Code GitHub Actions und Drittanbieter-Agent-SDK-Apps nicht mehr auf die interaktiven Pro/Max-Kontingente angerechnet. Ein neues separates Agent-SDK-Guthaben gilt: 100 $/Monat für Max 5x-Pläne. Hintergrund-Agent-Stacks (z. B. Tickets → Agents → Hooks → Executor → claude -p) werden dies schnell aufbrauchen.

14. Mai 2026, 12:16 UTC

OpenClawRadar