Проблемы и обходные пути сжатия сессий Claude AI

Как работает сжатие
Сессии Claude хранятся в виде файлов JSONL по пути ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl. Каждый шаг диалога представляет собой JSON-блок. При срабатывании сжатия исходные блоки остаются в файле, но добавляется новый блок со сжатым резюме. После сжатия модель работает с резюме, а не с полной историей диалога.
Результаты тестирования
На проекте по программированию с заполнением контекста на 90% (до увеличения лимита до 1 млн токенов) пользователь протестировал 10 вопросов, охватывающих простой поиск, цепочки зависимостей из 6 шагов, разрешение сущностей, цепочки отрицаний, обнаружение отсутствия и обнаружение конфликтов.
- До сжатия: точность ~9,75/10 с Opus 4.6, находившим разрозненные факты в 418 тыс. токенов
- После сжатия (стандартного): точность ~5/10 с 3 461 токеном (сжатие в 121 раз). Та же сессия, те же вопросы привели к галлюцинациям и неверным ответам.
- После сжатия (ручного с Opus): точность ~9,75/10 с 6 080 токенами (сжатие в 69 раз). Использование пользовательского промпта для сжатия с Opus сохранило важную информацию.
Причина различий
Согласно документации Anthropic, API по умолчанию использует ту же модель для сжатия. Пользователь запускал Opus 4.6 на средних вычислительных мощностях, поэтому стандартное сжатие также должно было использовать Opus. Разница в качестве указывает на проблемы с промптом для суммаризации, бюджетом на вычисления/мышление или и тем, и другим.
Обходные пути
Подход 1: Сжатие с Opus — отключить автосжатие и реализовать фоновый процесс, отслеживающий количество токенов для экземпляров Claude Code. Запускать сжатие с помощью Opus с пользовательским промптом (возможно, с авторизацией пользователя).
Подход 2: Предварительная инициализация с spaCy NER — вместо запуска суб-агентов с нулевым контекстом использовать spaCy NER для извлечения имён собственных, чисел, названий сервисов, портов и ключевых идентификаторов из файлов проекта. Внедрять это как лёгкий брифинг по сущностям (несколько сотен токенов) при запуске, чтобы информировать агентов о существующих ресурсах без излишней нарративной нагрузки.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

CipherClaw: Использование защитной персоны для аудита кода с помощью Claude
Разработчик использовал CipherClaw, персонажа CLAUDE.md по имени TALON, чтобы заставить Claude Code мыслить как архитектор безопасности. Запуск на приложении Next.js выявил 17 проблем безопасности, включая критические уязвимости, такие как неаутентифицированные конечные точки, возвращающие данные администратора, и хардкодированные токены аутентификации.

Argus: Приложение для GitHub, которое проверяет файлы CLAUDE.md и публикует оценки в запросах на слияние (PR)
Argus — это приложение для GitHub, созданное с помощью Claude Code, которое проверяет файлы CLAUDE.md и выставляет оценку для каждого запроса на слияние. После тестирования на нескольких репозиториях наиболее частыми ошибками оказались отсутствие явных ограничений области действия и путей эскалации.

the-knowledge-guy: Превратите свою книжную полку в репетитора с помощью навыков Claude Code
Набор навыков Claude Code, который обрабатывает ваши книги в форматах PDF/EPUB локально и позволяет задавать вопросы, получать объяснения по темам или извлекать шпаргалки — всё с цитированием из вашей библиотеки.

Расширение Compass для Chrome добавляет инструменты навигации в Claude и ChatGPT
Разработчик создал бесплатное расширение для Chrome под названием Compass, которое добавляет мини-карту промптов, фиксированные заголовки при прокрутке, контрольные списки сессий и шаблоны для создания промптов в интерфейсы Claude и ChatGPT, чтобы решить проблемы навигации в длинных диалогах.