ベンチマークにより、CLIツールが構造ナビゲーションを通じてClaudeコードトークンコストを32%削減することが示されました

✍️ OpenClawRadar📅 公開日: March 24, 2026🔗 Source
ベンチマークにより、CLIツールが構造ナビゲーションを通じてClaudeコードトークンコストを32%削減することが示されました
Ad

開発者が、ScopeというCLIツールをオープンソース化しました。このツールは、Claude Codeエージェントに「参照の検索」や「定義へ移動」などのIDE機能に似た、構造的なコードナビゲーション機能を提供します。このツールは、tree-sitterとSQLiteを使用してRustで構築されました。

ツールの機能

このツールは、エージェントに次のようなコマンドを提供します:

  • 「この6,000トークンのクラスの180トークン要約を表示」
  • 「コードの名前ではなく、その機能で検索」

現在、TypeScriptとC#をサポートしており、エージェントがデフォルトのgrepベースのアプローチよりも効率的にコードをナビゲートできるようにすることを目指しています。

ベンチマーク手法

開発者は、181ファイルのC#コードベースで、Sonnet 4.6を使用して54回の自動実行を実施しました:

  • 6つのタスクカテゴリ
  • 3つの条件:ベースライン、ツール利用可能、アーキテクチャをCLAUDE.mdに事前読み込み
  • 各条件を3回繰り返し

すべての実行で完全なNDJSONキャプチャが記録され、トークンを新規入力、キャッシュ作成、キャッシュ読み取り、出力に分解しました。ベンチマークランナーとテレメトリキャプチャはリポジトリに含まれています。

Ad

主な発見

予想に反して、ツールを使用したエージェントはより多くのファイルを読み取り(平均6.8から9.7ファイル、ベースライン比)ましたが、セッションあたりのコード編集が67%増加し、より少ないターンで完了しました。

コスト削減は、より短い会話によるキャッシュ蓄積の減少からもたらされました。トークンコストの約90%はキャッシュ蓄積に起因しています。

全体の結果:

  • タスクあたりのコストが32%削減
  • ナビゲーション効率が2倍向上(編集あたりのナビゲーションアクション)
  • ナビゲーション対編集比率が25:1(ベースライン)から13:1(ツール使用時)、12:1(アーキテクチャ事前読み込み時)に改善

結果はタスクタイプによって異なりました:

  • バグ修正:コスト62%削減
  • 新機能:コスト49%削減
  • 横断的変更:コスト46%削減
  • 発見とリファクタリングタスク:利点なし(ベースラインエージェントは既にこれらを適切にナビゲート)

重要な注意点

開発者は、いくつかの制限を指摘しています:

  • p値はn=6のペア観測で0.05に達していない(傾向は一貫しているが、統計的有意性を得るにはサンプルが小さすぎる)
  • これまでC#のみでベンチマーク実施(TypeScriptサポートは存在するが、まだベンチマークされていない)
  • コスト計算は現在のSonnet 4.6 APIレートを使用:新規入力 $3/M、キャッシュ書き込み $3.75/M、キャッシュ読み取り $0.30/M、出力 $15/M

このツールはオープンソースであり、エージェントのトークン効率向上を実験したい開発者は、github.com/rynhardt-potgieter/scopeで利用できます。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

OpenAlly:電話制御機能付きAndroid用ローカルAIアシスタント
Tools

OpenAlly:電話制御機能付きAndroid用ローカルAIアシスタント

OpenAllyは、組み込みNode.jsプロセスを介してスマートフォン上でローカルにAIアシスタントを実行するAndroidアプリで、51の組み込みスキルとAsterコンパニオンによる電話制御機能を備えています。19以上のメッセージングプラットフォームに接続し、独自のAPIキーを使用して18のモデルプロバイダーをサポートします。

OpenClawRadar
InsForge:Claudeコードエージェントのためのバックエンドセマンティックレイヤー
Tools

InsForge:Claudeコードエージェントのためのバックエンドセマンティックレイヤー

InsForgeは、Claude CodeエージェントがAPI統合を推測する代わりに、MCPを通じて検査・設定できる構造化コンポーネントとして、認証、PostgreSQLデータベース、S3互換ストレージ、エッジ/サーバーレス関数、モデルゲートウェイ、サイトデプロイの6つのバックエンドプリミティブを公開しています。

OpenClawRadar
2026年エルメスエージェント代替品総まとめ:OpenClawからmemU Botまでのセルフホストオプション
Tools

2026年エルメスエージェント代替品総まとめ:OpenClawからmemU Botまでのセルフホストオプション

ClawHubのセキュリティ問題後、Hermesをローンチから運用してきた開発者が、すべてのセルフホスト型およびマネージド代替案をテスト。主な発見: OpenClaw (370kスター) だが4日間で9件のCVE、約20%が悪意あるパッケージ; TrustClawはOAuth/サンドボックスで再構築; nanobotは約4000行のPythonでMCP対応; memU Botは独自の構造化メモリを搭載。マネージドオプションには、Perplexity Computer (19モデル、月200ドル)、Claude Cowork (実際のMacアプリを起動)、KimiClaw (40GB RAG、K2.5固定、中国データ法適用) など。詳細はソース参照。

OpenClawRadar
Argus: Claude Codeのリアルタイム可観測性を実現するオープンソースVS Code拡張機能
Tools

Argus: Claude Codeのリアルタイム可観測性を実現するオープンソースVS Code拡張機能

ArgusはVS Code内でClaude Codeのエージェントステップをリアルタイムに可視化し、タイムライン、依存関係グラフ、コスト/ループ検出を表示して、トークンを浪費する動作をデバッグします。

OpenClawRadar