Benchmark zeigt: CLI-Tool reduziert Claude-Code-Token-Kosten um 32 % durch strukturelle Navigation

Ein Entwickler hat ein CLI-Tool namens Scope quelloffen gemacht, das Claude-Code-Agenten strukturelle Code-Navigationsfähigkeiten bietet, ähnlich wie IDE-Funktionen wie "Referenzen finden" und "Zur Definition springen". Das Tool wurde in Rust mit tree-sitter und SQLite entwickelt.
Was das Tool leistet
Das Tool gibt Agenten Befehle wie:
- "zeige mir eine 180-Token-Zusammenfassung dieser 6.000-Token-Klasse"
- "suche nach dem, was der Code tut, nicht nach seinem Namen"
Es unterstützt derzeit TypeScript und C# mit dem Ziel, Agenten dabei zu helfen, Code effizienter zu navigieren als mit ihrem standardmäßigen grep-basierten Ansatz.
Benchmark-Methodik
Der Entwickler führte 54 automatisierte Durchläufe mit Sonnet 4.6 über eine 181-Dateien umfassende C#-Codebasis durch mit:
- 6 Aufgabenkategorien
- 3 Bedingungen: Baseline, Tool verfügbar, Architektur vorab in CLAUDE.md geladen
- 3 Wiederholungen pro Bedingung
Bei jedem Durchlauf wurde eine vollständige NDJSON-Aufzeichnung erstellt, um Token in neue Eingaben, Cache-Erstellung, Cache-Lesevorgänge und Ausgaben zu zerlegen. Der Benchmark-Runner und die Telemetrie-Erfassung sind im Repository enthalten.
Wichtige Erkenntnisse
Entgegen den Erwartungen lasen Agenten mit dem Tool mehr Dateien (6,8 bis 9,7 im Durchschnitt vs. Baseline), führten aber 67 % mehr Codeänderungen pro Sitzung durch und beendeten Aufgaben in weniger Runden.
Die Einsparungen resultierten aus kürzeren Konversationen, die die Cache-Akkumulation reduzierten. Etwa 90 % der Token-Kosten entfallen auf die Cache-Akkumulation.
Gesamtergebnisse:
- 32 % niedrigere Kosten pro Aufgabe
- 2-fache Navigationseffizienz (Navigationsaktionen pro Änderung)
- Navigations-zu-Änderungs-Verhältnis verbesserte sich von 25:1 (Baseline) auf 13:1 (mit Tool) und 12:1 (mit vorab geladener Architektur)
Die Ergebnisse variierten je nach Aufgabentyp:
- Fehlerbehebungen: -62 % Kosten
- Neue Funktionen: -49 % Kosten
- Übergreifende Änderungen: -46 % Kosten
- Entdeckungs- und Refactoring-Aufgaben: kein Vorteil (Baseline-Agenten navigieren hier bereits gut)
Wichtige Einschränkungen
Der Entwickler weist auf mehrere Einschränkungen hin:
- p-Werte erreichen bei n=6 gepaarten Beobachtungen nicht 0,05 (die Richtung ist konsistent, aber die Stichprobe ist für statistische Signifikanz zu klein)
- Bisher nur mit C# getestet (TypeScript-Unterstützung existiert, wurde aber noch nicht benchmarked)
- Kostenberechnung verwendet aktuelle Sonnet 4.6 API-Preise: neue Eingabe $3/M, Cache-Schreiben $3,75/M, Cache-Lesen $0,30/M, Ausgabe $15/M
Das Tool ist quelloffen und verfügbar unter github.com/rynhardt-potgieter/scope für Entwickler, die experimentieren möchten, um die Token-Effizienz von Agenten zu verbessern.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Heartbeat-Gateway: Ereignisgesteuerter Ersatz für Cron-Abfragen in OpenClaw
Heartbeat-gateway ist ein Open-Source-Python-Tool, das cron-basiertes Polling durch Webhook-gesteuerte Ereignisse für OpenClaw ersetzt. Es reduziert die API-Kosten von ~86 $/Monat auf ~4,50 $/Monat und verbessert die Latenz von bis zu 30 Minuten auf unter 2 Sekunden.

Ausführen von NemoClaw mit lokalem vLLM: Setup-Notizen und Beobachtungen zum Agent-Engineering
Ein Entwickler dokumentierte die Ausführung von NVIDIAs sandboxed AI-Agentenplattform NemoClaw mit einem lokalen Nemotron 9B v2-Modell über vLLM auf WSL2. Zu den wichtigsten Erkenntnissen gehören Details zum Inferenz-Routing, Kompatibilitätsprobleme mit Parsern und Beobachtungen zur Kluft in der Agentenentwicklung.

Semble: Codesuche für KI-Agenten mit 98 % weniger Tokens als grep+read
Semble ist eine quelloffene Code-Suchbibliothek für KI-Agenten, die statische Model2Vec-Embeddings mit BM25 kombiniert und vollständig auf CPU läuft. Es indiziert ein Repository in ~250ms und beantwortet Suchanfragen in ~1.5ms, wobei es eine NDCG@10 von 0.854 erreicht – 99% der Qualität eines 137M-Parameter-Transformers – bei gleichzeitig 98% weniger Token als grep+read.

Throttle Meter: Open-Source Claude Code-Nutzungszähler für macOS
Open-Source macOS-Menüleisten-App, die lokale Claude Code-Logs liest, um Echtzeit-Nutzung der letzten 5 Stunden und wöchentliche Nutzung mit Schwellenwertbenachrichtigungen und Token-sparenden Hooks anzuzeigen. Hat auch einen €19 kommerziellen Ableger mit Exact-Modus (liest claude.ais interne API über Safari).