Проблемы и обходные пути сжатия сессий Claude AI

✍️ OpenClawRadar📅 Опубликовано: 17 марта 2026 г.🔗 Source

Как работает сжатие

Сессии Claude хранятся в виде файлов JSONL по пути ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl. Каждый шаг диалога представляет собой JSON-блок. При срабатывании сжатия исходные блоки остаются в файле, но добавляется новый блок со сжатым резюме. После сжатия модель работает с резюме, а не с полной историей диалога.

Результаты тестирования

На проекте по программированию с заполнением контекста на 90% (до увеличения лимита до 1 млн токенов) пользователь протестировал 10 вопросов, охватывающих простой поиск, цепочки зависимостей из 6 шагов, разрешение сущностей, цепочки отрицаний, обнаружение отсутствия и обнаружение конфликтов.

До сжатия: точность ~9,75/10 с Opus 4.6, находившим разрозненные факты в 418 тыс. токенов
После сжатия (стандартного): точность ~5/10 с 3 461 токеном (сжатие в 121 раз). Та же сессия, те же вопросы привели к галлюцинациям и неверным ответам.
После сжатия (ручного с Opus): точность ~9,75/10 с 6 080 токенами (сжатие в 69 раз). Использование пользовательского промпта для сжатия с Opus сохранило важную информацию.

Причина различий

Согласно документации Anthropic, API по умолчанию использует ту же модель для сжатия. Пользователь запускал Opus 4.6 на средних вычислительных мощностях, поэтому стандартное сжатие также должно было использовать Opus. Разница в качестве указывает на проблемы с промптом для суммаризации, бюджетом на вычисления/мышление или и тем, и другим.

Обходные пути

Подход 1: Сжатие с Opus — отключить автосжатие и реализовать фоновый процесс, отслеживающий количество токенов для экземпляров Claude Code. Запускать сжатие с помощью Opus с пользовательским промптом (возможно, с авторизацией пользователя).

Подход 2: Предварительная инициализация с spaCy NER — вместо запуска суб-агентов с нулевым контекстом использовать spaCy NER для извлечения имён собственных, чисел, названий сервисов, портов и ключевых идентификаторов из файлов проекта. Внедрять это как лёгкий брифинг по сущностям (несколько сотен токенов) при запуске, чтобы информировать агентов о существующих ресурсах без излишней нарративной нагрузки.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

CipherClaw: Использование защитной персоны для аудита кода с помощью Claude

Разработчик использовал CipherClaw, персонажа CLAUDE.md по имени TALON, чтобы заставить Claude Code мыслить как архитектор безопасности. Запуск на приложении Next.js выявил 17 проблем безопасности, включая критические уязвимости, такие как неаутентифицированные конечные точки, возвращающие данные администратора, и хардкодированные токены аутентификации.

13 апр. 2026 г., 12:15 UTC

OpenClawRadar

Инструменты

Argus: Приложение для GitHub, которое проверяет файлы CLAUDE.md и публикует оценки в запросах на слияние (PR)

Argus — это приложение для GitHub, созданное с помощью Claude Code, которое проверяет файлы CLAUDE.md и выставляет оценку для каждого запроса на слияние. После тестирования на нескольких репозиториях наиболее частыми ошибками оказались отсутствие явных ограничений области действия и путей эскалации.

18 апр. 2026 г., 22:45 UTC

OpenClawRadar

Инструменты

the-knowledge-guy: Превратите свою книжную полку в репетитора с помощью навыков Claude Code

Набор навыков Claude Code, который обрабатывает ваши книги в форматах PDF/EPUB локально и позволяет задавать вопросы, получать объяснения по темам или извлекать шпаргалки — всё с цитированием из вашей библиотеки.

21 мая 2026 г., 12:16 UTC

OpenClawRadar

Инструменты

Расширение Compass для Chrome добавляет инструменты навигации в Claude и ChatGPT

Разработчик создал бесплатное расширение для Chrome под названием Compass, которое добавляет мини-карту промптов, фиксированные заголовки при прокрутке, контрольные списки сессий и шаблоны для создания промптов в интерфейсы Claude и ChatGPT, чтобы решить проблемы навигации в длинных диалогах.

17 апр. 2026 г., 09:45 UTC

OpenClawRadar