Claude AI Sitzungskomprimierung: 9.75/10 auf 5/10 Genauigkeit Workarounds

Wie Komprimierung funktioniert

Claude-Sitzungen werden als JSONL-Dateien unter ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl gespeichert. Jeder Gesprächsschritt ist ein JSON-Block. Wenn die Komprimierung ausgelöst wird, bleiben die ursprünglichen Blöcke in der Datei erhalten, aber ein neuer Block mit einer komprimierten Zusammenfassung wird angehängt. Nach der Komprimierung arbeitet das Modell mit der Zusammenfassung anstelle des vollständigen Gesprächsverlaufs.

Testergebnisse

Mit einem Codierungsprojekt bei 90 % Kontextfüllung (vor der Erhöhung auf 1 Million Tokens) testete der Benutzer 10 Fragen zu einfachem Abruf, 6-stufigen Abhängigkeitsketten, Entitätsdisambiguierung, Negationsverkettung, Abwesenheitserkennung und Konflikterkennung.

Vor der Komprimierung: ~9,75/10 Genauigkeit mit Opus 4.6, das verstreute Fakten über 418.000 Tokens fand
Nach der Komprimierung (Standard): ~5/10 Genauigkeit mit 3.461 Tokens (121-fache Komprimierung). Dieselbe Sitzung, dieselben Fragen führten zu halluzinierten falschen Antworten.
Nach der Komprimierung (Manuell mit Opus): ~9,75/10 Genauigkeit mit 6.080 Tokens (69-fache Komprimierung). Die Verwendung eines benutzerdefinierten Komprimierungsprompts mit Opus bewahrte wichtige Informationen.

Warum der Unterschied

Laut der Dokumentation von Anthropic verwendet die API standardmäßig dasselbe Modell für die Komprimierung. Der Benutzer lief Opus 4.6 auf mittlerer Rechenleistung, daher hätte die Standardkomprimierung ebenfalls Opus verwenden sollen. Der Qualitätsunterschied deutet auf Probleme mit dem Zusammenfassungsprompt, dem Denk-/Rechenbudget oder beidem hin.

Workarounds

Ansatz 1: Opus-Komprimierung – Automatische Komprimierung deaktivieren und einen Hintergrundprozess implementieren, der Token-Zählungen für Claude Code-Instanzen misst. Komprimierung mit Opus und einem benutzerdefinierten Prompt auslösen (möglicherweise mit Benutzerautorisierung).

Ansatz 2: spaCy NER-Vorausfüllung – Anstatt Sub-Agenten ohne Kontext zu starten, spaCy NER verwenden, um Eigennamen, Zahlen, Dienstnamen, Ports und Schlüsselidentifikatoren aus Projektdateien zu extrahieren. Dies als leichtgewichtige Entitäts-Einführung (wenige hundert Tokens) beim Start einspritzen, um Agenten über vorhandene Ressourcen zu informieren, ohne narrativen Ballast.

📖 Read the full source: r/ClaudeAI

Claude AI-Sitzungskomprimierungsprobleme und Workarounds

Wie Komprimierung funktioniert

Testergebnisse

Warum der Unterschied

Workarounds

👀 Siehe auch

Patina: Eine Claude-Code-Fähigkeit, die KI-Schreibmuster erkennt und umschreibt

Prompt für den deutschen Bürokratie-Assistenten Claude: Strukturierte juristische Korrespondenz

Echtzeit-Desktop-Overlay zur Überwachung der Nutzungslimits von Claude Code

Mehr-Agenten-Debatten-App entwickelt mit Claude, ElevenLabs und Flux