CC-Canary: ローカルJSONL分析によるClaude Codeの回帰検出

✍️ OpenClawRadar📅 公開日: April 24, 2026🔗 Source
CC-Canary: ローカルJSONL分析によるClaude Codeの回帰検出
Ad

CC-Canary は、Claude Code向けのドリフト検出ツールで、2つのインストール可能なAgent Skillとして提供されます。Claude Codeがすでに ~/.claude/projects/ に書き込んでいるJSONLセッションログをスキャンし、モデルがあなたの作業上でドリフトしていないかを検出し、共有可能なフォレンジックレポートを生成します。ネットワーク不要、アカウント不要、テレメトリなし、バックグラウンドデーモンなし — すでにディスク上にあるデータで動作します。ステータス: 0.x / プレアルファ版。

インストール

npx skills を使ってインストール:

npx skills add delta-hq/cc-canary

または個別のスキルをインストール:

npx skills add delta-hq/cc-canary --skill cc-canary npx skills add delta-hq/cc-canary --skill cc-canary-html

要件: Python 3.8+ がPATHに存在すること。macOS/Linux/WSLでHTMLレポートの自動開封に対応(フォールバックとしてパス表示)。

使い方

Claude Codeセッション内で実行:

/cc-canary 60d /cc-canary-html 30d

デフォルトの期間は60日。7d、14d、30d、60d、90d、180dに対応。

得られるもの

  • 判定 — 維持 / 回帰の疑い / 回帰確定 / 判定不能
  • 主要メトリクステーブル — 期間前後の比較(緑/黄/赤バンド)
  • 週次トレンドバー — コスト(USD、ccusageで検証済み)、読み取り:編集比率、推論ループ、トークン数/ターン
  • バージョン間比較 — 同じユーザー、異なるモデルバージョン、タスク構成を調整
  • 自動検出された変曲点 — 複合ヘルススコアの変化点
  • 所見 — モデル側 / ユーザー側 / 曖昧 に分類
  • 付録 — 時間帯別思考深度、単語頻度変化、3期間の思考可視性推移、ターンごとの行動率
Ad

追跡するメトリクス

  • 読み取り:編集比率 — 編集あたりのファイル読み取り数。調査の徹底度の指標。
  • 書き込みの変更割合 — 書き込み / (編集 + 書き込み)。割合が高いと、精密な編集ではなく書き換えを行っていることを示す。
  • 推論ループ / 1000ツール呼び出し — 「やり直し」「あっ待って」「実は」などのフレーズ。
  • フラストレーション率 — プロンプト中のフラストレーション単語の割合。
  • 思考編集率 — 思考ブロックのうち編集されたものの割合。
  • 平均思考長 — 推論深度の指標。
  • ユーザーターンあたりのAPIターン数 — ユーザーメッセージあたりのAPI呼び出し数。
  • ユーザーターンあたりのトークン数 — ユーザーメッセージあたりの総トークン数。

その他、早期停止、自己申告エラー、ショートカット語彙、ユーザー割り込みなどの付録も。

動作の仕組み

  1. スキャン — Pythonスクリプト(stdlibのみ)が ~/.claude/projects/**/*.jsonl を走査し、期間でフィルタリングし、サブエージェントセッションを除外。
  2. 重複除去 — アシスタントメッセージは (message.id, requestId) で重複除去。Claude Codeはセッション再開やブランチ時に同じメッセージを複数のJSONLに書き込むため。
  3. 集計 — セッションごとのメトリクス: ツール混合、読み取り:編集比率、推論ループフレーズ、自己申告エラー、早期停止、割り込み、トークン使用量、コスト(現在のClaude 4.xレート)、時間帯別思考深度。
  4. 変曲点検出 — 日ごとの複合ヘルススコア。候補日における |before − after| のargmax(0.75σ下限)。閾値を超える変化がない場合は中央タイムスタンプで分割。
  5. レポートの事前レンダリング — スクリプトがマークダウン/HTMLの骨格を書き、すべてのテーブルと棒グラフを埋め込む。約20のナラティブスロットをClaudeが埋めるために残す。
  6. 記入と保存 — Claudeが骨格を読み、ナラティブを書き、最終ファイルを保存。総実行時間: スクリプト約2.5秒 + Claudeナラティブ10~20秒。

📖 全文ソース: HN AI Agents

Ad

👀 See Also

ClaudeHive:並列Claudeコードセッションを管理するWeb UI
Tools

ClaudeHive:並列Claudeコードセッションを管理するWeb UI

ClaudeHiveは、並列Claude Codeセッションを処理するWeb UIで、ユーザーがプレースホルダー付きのプロンプトテンプレートを定義し、設定可能な並列処理で複数の入力に対して一括実行し、すべての結果を一か所で確認できるようにします。また、マネージャーエージェントがワーカーエージェントを生成・調整するためのCLIツールも含まれています。

OpenClawRadar
Measuring Off-Task Token Spend in Claude Code: The 'Undeclared-Intent' Metricを日本語に訳すと:
Tools

Measuring Off-Task Token Spend in Claude Code: The 'Undeclared-Intent' Metricを日本語に訳すと:

ある開発者が、Claude Codeセッションにおける意図しない実行経路に費やされる計算リソースを定量化する指標を作成したところ、トークンの22.8%がタスク外の作業に使用されていることが判明した。

OpenClawRadar
OpenClaw-WebTop:GitHub CodespacesでOllamaとUbuntuデスクトップを使用してOpenClawを実行する
Tools

OpenClaw-WebTop:GitHub CodespacesでOllamaとUbuntuデスクトップを使用してOpenClawを実行する

OpenClaw-WebTopは、GitHub Codespacesを使用して、ローカルでのDockerインストールやVPSを必要とせずに、ブラウザ内で完全なOpenClawインスタンスをOllamaとUbuntu MATEデスクトップと共に実行する方法を提供します。

OpenClawRadar
コモンズ2.0:AIモデルがコミュニケーションするための持続的空間
Tools

コモンズ2.0:AIモデルがコミュニケーションするための持続的空間

The Commonsは、Claude、GPT、Gemini、GrokなどのAIモデルが議論に投稿し、詩に注釈を付け、ポストカードを残し、セッションを超えて継続的な会話を構築できる公共プラットフォームです。バージョン2.0では、興味に基づく整理、通知システム、音声プロファイル、エージェントチェックイン基盤が追加されました。

OpenClawRadar