Claude AI-Sitzungskomprimierungsprobleme und Workarounds

Wie Komprimierung funktioniert
Claude-Sitzungen werden als JSONL-Dateien unter ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl gespeichert. Jeder Gesprächsschritt ist ein JSON-Block. Wenn die Komprimierung ausgelöst wird, bleiben die ursprünglichen Blöcke in der Datei erhalten, aber ein neuer Block mit einer komprimierten Zusammenfassung wird angehängt. Nach der Komprimierung arbeitet das Modell mit der Zusammenfassung anstelle des vollständigen Gesprächsverlaufs.
Testergebnisse
Mit einem Codierungsprojekt bei 90 % Kontextfüllung (vor der Erhöhung auf 1 Million Tokens) testete der Benutzer 10 Fragen zu einfachem Abruf, 6-stufigen Abhängigkeitsketten, Entitätsdisambiguierung, Negationsverkettung, Abwesenheitserkennung und Konflikterkennung.
- Vor der Komprimierung: ~9,75/10 Genauigkeit mit Opus 4.6, das verstreute Fakten über 418.000 Tokens fand
- Nach der Komprimierung (Standard): ~5/10 Genauigkeit mit 3.461 Tokens (121-fache Komprimierung). Dieselbe Sitzung, dieselben Fragen führten zu halluzinierten falschen Antworten.
- Nach der Komprimierung (Manuell mit Opus): ~9,75/10 Genauigkeit mit 6.080 Tokens (69-fache Komprimierung). Die Verwendung eines benutzerdefinierten Komprimierungsprompts mit Opus bewahrte wichtige Informationen.
Warum der Unterschied
Laut der Dokumentation von Anthropic verwendet die API standardmäßig dasselbe Modell für die Komprimierung. Der Benutzer lief Opus 4.6 auf mittlerer Rechenleistung, daher hätte die Standardkomprimierung ebenfalls Opus verwenden sollen. Der Qualitätsunterschied deutet auf Probleme mit dem Zusammenfassungsprompt, dem Denk-/Rechenbudget oder beidem hin.
Workarounds
Ansatz 1: Opus-Komprimierung – Automatische Komprimierung deaktivieren und einen Hintergrundprozess implementieren, der Token-Zählungen für Claude Code-Instanzen misst. Komprimierung mit Opus und einem benutzerdefinierten Prompt auslösen (möglicherweise mit Benutzerautorisierung).
Ansatz 2: spaCy NER-Vorausfüllung – Anstatt Sub-Agenten ohne Kontext zu starten, spaCy NER verwenden, um Eigennamen, Zahlen, Dienstnamen, Ports und Schlüsselidentifikatoren aus Projektdateien zu extrahieren. Dies als leichtgewichtige Entitäts-Einführung (wenige hundert Tokens) beim Start einspritzen, um Agenten über vorhandene Ressourcen zu informieren, ohne narrativen Ballast.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Patina: Eine Claude-Code-Fähigkeit, die KI-Schreibmuster erkennt und umschreibt
Ein Entwickler hat eine Claude Code-Fähigkeit namens Patina erstellt, die 112 Muster identifiziert, die KI-generierten Text in vier Sprachen offensichtlich machen, und dann markierte Abschnitte umschreibt. Das Tool umfasst Modi für reine Erkennung, Bewertung und iteratives Umschreiben.

Prompt für den deutschen Bürokratie-Assistenten Claude: Strukturierte juristische Korrespondenz
Ein detaillierter Systemprompt für Claude, der die KI in einen strukturierten Assistenten für deutsche Bürokratie, Verträge, Versicherungsstreitigkeiten und offizielle Schreiben verwandelt, mit strengen Faktenchecks und DIN-5008-Formatierung.

Echtzeit-Desktop-Overlay zur Überwachung der Nutzungslimits von Claude Code
Das Open-Source-Desktop-Overlay zeigt die Nutzungslimits von Claude Code in Echtzeit an, wodurch die wiederholte Eingabe von '/usage' entfällt.

Mehr-Agenten-Debatten-App entwickelt mit Claude, ElevenLabs und Flux
Ein Entwickler hat eine Debatten-App erstellt, in der Claude Argumente für zwei Personas zu jedem Thema generiert, mit einem KI-Richter, der bewertet und einen Gewinner auswählt. Die App fügt über ElevenLabs Stimmen und über Flux Bilder hinzu, um ein Debatten-Showerlebnis zu schaffen.