Проблемы и обходные пути сжатия сессий Claude AI

✍️ OpenClawRadar📅 Опубликовано: 17 марта 2026 г.🔗 Source
Проблемы и обходные пути сжатия сессий Claude AI
Ad

Как работает сжатие

Сессии Claude хранятся в виде файлов JSONL по пути ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl. Каждый шаг диалога представляет собой JSON-блок. При срабатывании сжатия исходные блоки остаются в файле, но добавляется новый блок со сжатым резюме. После сжатия модель работает с резюме, а не с полной историей диалога.

Результаты тестирования

На проекте по программированию с заполнением контекста на 90% (до увеличения лимита до 1 млн токенов) пользователь протестировал 10 вопросов, охватывающих простой поиск, цепочки зависимостей из 6 шагов, разрешение сущностей, цепочки отрицаний, обнаружение отсутствия и обнаружение конфликтов.

  • До сжатия: точность ~9,75/10 с Opus 4.6, находившим разрозненные факты в 418 тыс. токенов
  • После сжатия (стандартного): точность ~5/10 с 3 461 токеном (сжатие в 121 раз). Та же сессия, те же вопросы привели к галлюцинациям и неверным ответам.
  • После сжатия (ручного с Opus): точность ~9,75/10 с 6 080 токенами (сжатие в 69 раз). Использование пользовательского промпта для сжатия с Opus сохранило важную информацию.
Ad

Причина различий

Согласно документации Anthropic, API по умолчанию использует ту же модель для сжатия. Пользователь запускал Opus 4.6 на средних вычислительных мощностях, поэтому стандартное сжатие также должно было использовать Opus. Разница в качестве указывает на проблемы с промптом для суммаризации, бюджетом на вычисления/мышление или и тем, и другим.

Обходные пути

Подход 1: Сжатие с Opus — отключить автосжатие и реализовать фоновый процесс, отслеживающий количество токенов для экземпляров Claude Code. Запускать сжатие с помощью Opus с пользовательским промптом (возможно, с авторизацией пользователя).

Подход 2: Предварительная инициализация с spaCy NER — вместо запуска суб-агентов с нулевым контекстом использовать spaCy NER для извлечения имён собственных, чисел, названий сервисов, портов и ключевых идентификаторов из файлов проекта. Внедрять это как лёгкий брифинг по сущностям (несколько сотен токенов) при запуске, чтобы информировать агентов о существующих ресурсах без излишней нарративной нагрузки.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Открытый исходный код Claude Skill структурирует знания о росте B2B SaaS для обеспечения согласованных рассуждений ИИ.
Инструменты

Открытый исходный код Claude Skill структурирует знания о росте B2B SaaS для обеспечения согласованных рассуждений ИИ.

Разработчик создал открытый навык Claude, который организует уроки партнерства с годовым доходом в $90 млн, 1800 пользовательских интервью и 5 кейсов SaaS в структурированные знания для Claude, улучшая качество ответов для сложных рабочих процессов, таких как проверка соответствия продукта рынку и планирование выхода на рынок.

OpenClawRadar
Лор: MCP-сервер, который обменивается историей сессий AI-агента между инструментами
Инструменты

Лор: MCP-сервер, который обменивается историей сессий AI-агента между инструментами

Lore — это MCP-сервер, который индексирует сессии ИИ-агентов в локальную базу данных SQLite, позволяя любому агенту, независимо от инструмента, получать доступ к истории сессий другого агента. Даже если сессии начинаются с чистого листа без общего контекста, агенты могут запрашивать прошлые разговоры по требованию.

OpenClawRadar
BuddyBoard: Соревновательная таблица лидеров для функции /buddy в Claude Code
Инструменты

BuddyBoard: Соревновательная таблица лидеров для функции /buddy в Claude Code

BuddyBoard — это инструмент, созданный сообществом, который формирует конкурентную таблицу лидеров для функции /buddy в Claude Code, генерируя коллекционные карточки со статистикой, уровнями редкости и BuddyDex, отслеживающим 1728 возможных комбинаций. Запустите npx buddy-board, чтобы отправить своего бадди в глобальный рейтинг.

OpenClawRadar
Open-Source Benchmark Runner для тестирования агентов OpenClaw на реальных рабочих процессах
Инструменты

Open-Source Benchmark Runner для тестирования агентов OpenClaw на реальных рабочих процессах

Новый проект с открытым исходным кодом позволяет оценивать агентов OpenClaw на ваших собственных частных, реальных задачах, определенных в YAML, с поддержкой импорта фактических рабочих пространств агентов.

OpenClawRadar