Benchmark zeigt: CLI-Tool reduziert Claude-Code-Token-Kosten um 32 % durch strukturelle Navigation

✍️ OpenClawRadar📅 Veröffentlicht: 24. März 2026🔗 Source
Benchmark zeigt: CLI-Tool reduziert Claude-Code-Token-Kosten um 32 % durch strukturelle Navigation
Ad

Ein Entwickler hat ein CLI-Tool namens Scope quelloffen gemacht, das Claude-Code-Agenten strukturelle Code-Navigationsfähigkeiten bietet, ähnlich wie IDE-Funktionen wie "Referenzen finden" und "Zur Definition springen". Das Tool wurde in Rust mit tree-sitter und SQLite entwickelt.

Was das Tool leistet

Das Tool gibt Agenten Befehle wie:

  • "zeige mir eine 180-Token-Zusammenfassung dieser 6.000-Token-Klasse"
  • "suche nach dem, was der Code tut, nicht nach seinem Namen"

Es unterstützt derzeit TypeScript und C# mit dem Ziel, Agenten dabei zu helfen, Code effizienter zu navigieren als mit ihrem standardmäßigen grep-basierten Ansatz.

Benchmark-Methodik

Der Entwickler führte 54 automatisierte Durchläufe mit Sonnet 4.6 über eine 181-Dateien umfassende C#-Codebasis durch mit:

  • 6 Aufgabenkategorien
  • 3 Bedingungen: Baseline, Tool verfügbar, Architektur vorab in CLAUDE.md geladen
  • 3 Wiederholungen pro Bedingung

Bei jedem Durchlauf wurde eine vollständige NDJSON-Aufzeichnung erstellt, um Token in neue Eingaben, Cache-Erstellung, Cache-Lesevorgänge und Ausgaben zu zerlegen. Der Benchmark-Runner und die Telemetrie-Erfassung sind im Repository enthalten.

Ad

Wichtige Erkenntnisse

Entgegen den Erwartungen lasen Agenten mit dem Tool mehr Dateien (6,8 bis 9,7 im Durchschnitt vs. Baseline), führten aber 67 % mehr Codeänderungen pro Sitzung durch und beendeten Aufgaben in weniger Runden.

Die Einsparungen resultierten aus kürzeren Konversationen, die die Cache-Akkumulation reduzierten. Etwa 90 % der Token-Kosten entfallen auf die Cache-Akkumulation.

Gesamtergebnisse:

  • 32 % niedrigere Kosten pro Aufgabe
  • 2-fache Navigationseffizienz (Navigationsaktionen pro Änderung)
  • Navigations-zu-Änderungs-Verhältnis verbesserte sich von 25:1 (Baseline) auf 13:1 (mit Tool) und 12:1 (mit vorab geladener Architektur)

Die Ergebnisse variierten je nach Aufgabentyp:

  • Fehlerbehebungen: -62 % Kosten
  • Neue Funktionen: -49 % Kosten
  • Übergreifende Änderungen: -46 % Kosten
  • Entdeckungs- und Refactoring-Aufgaben: kein Vorteil (Baseline-Agenten navigieren hier bereits gut)

Wichtige Einschränkungen

Der Entwickler weist auf mehrere Einschränkungen hin:

  • p-Werte erreichen bei n=6 gepaarten Beobachtungen nicht 0,05 (die Richtung ist konsistent, aber die Stichprobe ist für statistische Signifikanz zu klein)
  • Bisher nur mit C# getestet (TypeScript-Unterstützung existiert, wurde aber noch nicht benchmarked)
  • Kostenberechnung verwendet aktuelle Sonnet 4.6 API-Preise: neue Eingabe $3/M, Cache-Schreiben $3,75/M, Cache-Lesen $0,30/M, Ausgabe $15/M

Das Tool ist quelloffen und verfügbar unter github.com/rynhardt-potgieter/scope für Entwickler, die experimentieren möchten, um die Token-Effizienz von Agenten zu verbessern.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Heartbeat-Gateway: Ereignisgesteuerter Ersatz für Cron-Abfragen in OpenClaw
Werkzeuge

Heartbeat-Gateway: Ereignisgesteuerter Ersatz für Cron-Abfragen in OpenClaw

Heartbeat-gateway ist ein Open-Source-Python-Tool, das cron-basiertes Polling durch Webhook-gesteuerte Ereignisse für OpenClaw ersetzt. Es reduziert die API-Kosten von ~86 $/Monat auf ~4,50 $/Monat und verbessert die Latenz von bis zu 30 Minuten auf unter 2 Sekunden.

OpenClawRadar
Ausführen von NemoClaw mit lokalem vLLM: Setup-Notizen und Beobachtungen zum Agent-Engineering
Werkzeuge

Ausführen von NemoClaw mit lokalem vLLM: Setup-Notizen und Beobachtungen zum Agent-Engineering

Ein Entwickler dokumentierte die Ausführung von NVIDIAs sandboxed AI-Agentenplattform NemoClaw mit einem lokalen Nemotron 9B v2-Modell über vLLM auf WSL2. Zu den wichtigsten Erkenntnissen gehören Details zum Inferenz-Routing, Kompatibilitätsprobleme mit Parsern und Beobachtungen zur Kluft in der Agentenentwicklung.

OpenClawRadar
Semble: Codesuche für KI-Agenten mit 98 % weniger Tokens als grep+read
Werkzeuge

Semble: Codesuche für KI-Agenten mit 98 % weniger Tokens als grep+read

Semble ist eine quelloffene Code-Suchbibliothek für KI-Agenten, die statische Model2Vec-Embeddings mit BM25 kombiniert und vollständig auf CPU läuft. Es indiziert ein Repository in ~250ms und beantwortet Suchanfragen in ~1.5ms, wobei es eine NDCG@10 von 0.854 erreicht – 99% der Qualität eines 137M-Parameter-Transformers – bei gleichzeitig 98% weniger Token als grep+read.

OpenClawRadar
Throttle Meter: Open-Source Claude Code-Nutzungszähler für macOS
Werkzeuge

Throttle Meter: Open-Source Claude Code-Nutzungszähler für macOS

Open-Source macOS-Menüleisten-App, die lokale Claude Code-Logs liest, um Echtzeit-Nutzung der letzten 5 Stunden und wöchentliche Nutzung mit Schwellenwertbenachrichtigungen und Token-sparenden Hooks anzuzeigen. Hat auch einen €19 kommerziellen Ableger mit Exact-Modus (liest claude.ais interne API über Safari).

OpenClawRadar