CC-Canary: Обнаружение регрессий в Claude Code с помощью локального анализа JSONL

✍️ OpenClawRadar📅 Опубликовано: 24 апреля 2026 г.🔗 Source
CC-Canary: Обнаружение регрессий в Claude Code с помощью локального анализа JSONL
Ad

CC-Canary — это инструмент обнаружения дрейфа для Claude Code, поставляемый в виде двух устанавливаемых Agent Skills. Он сканирует журналы сессий в формате JSONL, которые Claude Code уже записывает в ~/.claude/projects/, определяет, не дрейфовала ли модель на вашей работе, и создает доступный для распространения судебно-медицинский отчет. Без сети, без аккаунта, без телеметрии, без фонового демона — работает на данных, уже находящихся на вашем диске. Статус: 0.x / пре-альфа.

Установка

Установка через npx skills:

npx skills add delta-hq/cc-canary

Или установка отдельных навыков:

npx skills add delta-hq/cc-canary --skill cc-canary npx skills add delta-hq/cc-canary --skill cc-canary-html

Требования: Python 3.8+ в PATH. macOS/Linux/WSL для автоматического открытия HTML-отчета (в противном случае выводится путь).

Использование

Из сессии Claude Code:

/cc-canary 60d /cc-canary-html 30d

Окно по умолчанию — 60 дней; поддерживаются 7d, 14d, 30d, 60d, 90d, 180d.

Что вы получите

  • Вердикт — HOLDING / SUSPECTED REGRESSION / CONFIRMED REGRESSION / INCONCLUSIVE
  • Таблица ключевых метрик — сравнение до и после с цветовыми индикаторами зеленый/желтый/красный
  • Недельные тренды — стоимость (USD, сверено с ccusage), соотношение чтения/редактирования, циклы рассуждений, токенов/шаг
  • Сравнение версий — один и тот же пользователь, разные версии модели, с контролем распределения задач
  • Автоматически определенная дата перегиба — разрыв в составном показателе здоровья
  • Выводы с классификацией: со стороны модели / со стороны пользователя / неоднозначные
  • Приложения — глубина мышления по часам, сдвиг частотности слов, переход видимости мышления за три периода, показатели поведения на шаг
Ad

Отслеживаемые метрики

  • Соотношение чтения/редактирования — количество чтений файлов на одно редактирование; показатель тщательности исследования
  • Доля записи в мутациях — Write / (Edit + Write); высокая доля означает перезапись вместо точечных правок
  • Циклы рассуждений на 1K вызовов инструментов — фразы типа "let me try again", "oh wait", "actually"
  • Уровень фрустрации — частота слов фрустрации в ваших запросах
  • Уровень редактирования мышления — доля скрытых блоков мышления относительно видимых
  • Средняя длина мышления — показатель глубины рассуждений
  • Шаги API на шаг пользователя — количество вызовов API на одно сообщение пользователя
  • Токены на шаг пользователя — общий объем токенов на одно сообщение пользователя

Плюс приложения для преждевременных остановок, само-признанных ошибок, сокращений-заменителей, прерываний пользователем и т.д.

Как это работает

  1. Сканирование — скрипт на Python (только стандартная библиотека) обходит ~/.claude/projects/**/*.jsonl, фильтрует по окну, исключает сессии под-агентов.
  2. Дедупликация — Сообщения ассистента дедуплицируются по (message.id, requestId), потому что Claude Code записывает одно и то же сообщение в несколько JSONL при возобновлении или ветвлении сессий.
  3. Агрегация — Метрики по сессиям: состав инструментов, соотношение чтения/редактирования, фразы циклов рассуждений, само-признанные ошибки, преждевременные остановки, прерывания, использование токенов, стоимость (текущие тарифы Claude 4.x), глубина мышления по часам.
  4. Обнаружение перегиба — Составной показатель здоровья по дням; argmax от |до − после| по кандидатам с порогом 0.75σ. Если разрыв не обнаружен, используется медианное разделение по временным меткам.
  5. Предварительная визуализация отчета — Скрипт формирует каркас Markdown/HTML с заполненными таблицами и столбчатыми диаграммами. Оставляет ~20 нарративных слотов для заполнения Claude.
  6. Заполнение и сохранение — Claude читает каркас, пишет нарратив, сохраняет итоговый файл. Общее время выполнения: ~2.5 с на скрипт + 10–20 с на нарратив Claude.

📖 Читать полный исходный код: HN AI Agents

Ad

👀 Смотрите также

Сервер MCP Log Reducer сокращает использование токенов при чтении логов кодом Claude
Инструменты

Сервер MCP Log Reducer сокращает использование токенов при чтении логов кодом Claude

Log Reducer — это MCP-сервер, который обрабатывает файлы журналов на стороне сервера перед отправкой сокращённого вывода в Claude Code, избегая попадания необработанных логов в контекстное окно. Он применяет 19 детерминированных преобразований, сжимающих логи на 50–90%, причём журнал из 2000 строк представляет собой 20 000+ токенов, удалённых из сессий.

OpenClawRadar
Создание самообновляющегося руководства по стилю письма для контента с использованием ИИ
Инструменты

Создание самообновляющегося руководства по стилю письма для контента с использованием ИИ

Команда, создающая платформу для извлечения голоса Noren, разработала руководство по стилю в формате Markdown на 117 строк, которое переписывается после каждой опубликованной статьи, используя Claude для соблюдения правил и запрещая слова, звучащие как ИИ, такие как 'cadence' и 'optimize'.

OpenClawRadar
Фреймворк визуальных подсказок заменяет текстовые запросы одним изображением для Claude AI
Инструменты

Фреймворк визуальных подсказок заменяет текстовые запросы одним изображением для Claude AI

Принцип Пропускной Способности v9 — это двунаправленная структурная система, которая использует единую блок-схему вместо текстовых промптов для Claude AI. Она предоставляет структурную диагностику или генеративные планы построения на основе параметров системы или целей.

OpenClawRadar
Claude для творческой работы: MCP-коннекторы для Blender, Adobe, Ableton и других
Инструменты

Claude для творческой работы: MCP-коннекторы для Blender, Adobe, Ableton и других

Anthropic выпустила набор MCP-коннекторов, позволяющих Claude взаимодействовать с творческими инструментами, включая Blender, Autodesk Fusion, Adobe Creative Cloud, Ableton Live и Splice, обеспечивая управление на естественном языке, скриптинг и автоматизацию пайплайнов.

OpenClawRadar