Benchmark Shows CLI Tool Reduces Claude Code Token Costs by 32% Through Structural Navigation

✍️ OpenClawRadar📅 게시일: March 24, 2026🔗 Source
Benchmark Shows CLI Tool Reduces Claude Code Token Costs by 32% Through Structural Navigation
Ad

A developer has open-sourced a CLI tool called Scope that provides Claude Code agents with structural code navigation capabilities, similar to IDE features like "find references" and "go to definition." The tool was built in Rust using tree-sitter and SQLite.

What the Tool Does

The tool gives agents commands like:

  • "show me a 180-token summary of this 6,000-token class"
  • "search by what code does, not what it's named"

It currently supports TypeScript and C#, with the goal of helping agents navigate code more efficiently than their default grep-based approach.

Benchmark Methodology

The developer ran 54 automated runs on Sonnet 4.6 across a 181-file C# codebase with:

  • 6 task categories
  • 3 conditions: baseline, tool available, architecture preloaded into CLAUDE.md
  • 3 repetitions each

Full NDJSON capture was recorded on every run to decompose tokens into fresh input, cache creation, cache reads, and output. The benchmark runner and telemetry capture are included in the repository.

Ad

Key Findings

Contrary to expectations, agents with the tool read more files (6.8 to 9.7 average vs. baseline) but made 67% more code edits per session and finished in fewer turns.

The savings came from shorter conversations, which reduced cache accumulation. Approximately 90% of token cost lives in cache accumulation.

Overall results:

  • 32% lower cost per task
  • 2x navigation efficiency (nav actions per edit)
  • Navigation-to-edit ratio improved from 25:1 (baseline) to 13:1 (with tool) and 12:1 (with architecture preloaded)

Results varied by task type:

  • Bug fixes: -62% cost
  • New features: -49% cost
  • Cross-cutting changes: -46% cost
  • Discovery and refactoring tasks: no advantage (baseline agents already navigate these fine)

Important Caveats

The developer notes several limitations:

  • p-values don't reach 0.05 at n=6 paired observations (direction is consistent but sample is too small for statistical significance)
  • Benchmarked on C# only so far (TypeScript support exists but hasn't been benchmarked yet)
  • Cost calculation uses current Sonnet 4.6 API rates: fresh input $3/M, cache write $3.75/M, cache read $0.30/M, output $15/M

The tool is open source and available at github.com/rynhardt-potgieter/scope for developers who want to experiment with improving agent token efficiency.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

오픈소스 MCP 서버는 AI 에이전트가 라이트닝 네트워크를 통해 L402 결제를 처리할 수 있도록 지원합니다.
Tools

오픈소스 MCP 서버는 AI 에이전트가 라이트닝 네트워크를 통해 L402 결제를 처리할 수 있도록 지원합니다.

FastMCP로 구축된 Python MCP 플러그인은 HTTP 402 결제 필요 응답을 가로채 라이트닝 네트워크 인보이스를 결제하고 AI 에이전트를 위한 데이터를 검색합니다. 이 저장소에는 실제 자금을 사용하지 않고 테스트할 수 있는 로컬 더미 에이전트가 포함되어 있습니다.

OpenClawRadar
AI 코딩 에이전트를 위한 멀티 모델 협업 워크플로우
Tools

AI 코딩 에이전트를 위한 멀티 모델 협업 워크플로우

개발자가 코딩 작업을 코딩 에이전트에 전달하기 전에 세 가지 AI 모델(GPT-4o를 설계자, Claude를 회의론자, Gemini를 통합자로 사용)을 통해 검토하는 웹 도구를 만들었습니다. 이 도구는 명시적인 제약 조건이 포함된 PLAN.md를 생성하며 사용자가 자신의 API 키를 가져와야 합니다.

OpenClawRadar
0Latency: MCP를 통한 AI 에이전트를 위한 지속적 메모리 계층
Tools

0Latency: MCP를 통한 AI 에이전트를 위한 지속적 메모리 계층

0Latency는 Claude 및 기타 AI 에이전트에 영구 메모리를 추가하는 MCP 서버로, 세션 간 메모리를 저장하여 컨텍스트 손실을 방지합니다. Claude Desktop, Claude Code, claude.ai, GPT, Gemini, Cursor 및 모든 MCP 호환 에이전트와 기본적으로 작동합니다.

OpenClawRadar
오픈소스 Claude 플러그인이 라이브 미리보기 기능을 갖춘 인터랙티브 비주얼 튜너를 생성합니다
Tools

오픈소스 Claude 플러그인이 라이브 미리보기 기능을 갖춘 인터랙티브 비주얼 튜너를 생성합니다

한 개발자가 CSS 값을 미세 조정하기 위한 슬라이더와 피그마 스타일의 무한 캔버스를 갖춘 단일 HTML 페이지를 생성할 수 있도록 하는 오픈소스 플러그인을 클로드 코드용으로 제작했습니다. 이 플러그인은 소스 파일을 읽고, 대화형 캔버스에 요소를 재현하며, 실시간 미리보기와 함께 정밀 조정을 위한 컨트롤을 제공합니다.

OpenClawRadar