PRECC-Tool senkt Claude Code API-Kosten durch Pre-Tool-Call-Kompression

PRECC ist ein Open-Source-Tool, das Claude Code API-Kosten reduziert, indem es redundanten Kontext komprimiert, bevor er das Modell erreicht. Es verwendet einen Pre-Tool-Call-Hook, der Bash-, Read- und Grep-Aufrufe abfängt, um Kompressionsalgorithmen anzuwenden.
Wie es funktioniert
Das Tool behebt Kostenprobleme, bei denen API-Rechnungen aufgrund von redundantem Kontext, der mehrfach gesendet wurde, stiegen. Häufige Quellen für Verschwendung sind:
- Dieselben Dateiinhalte, die wiederholt gesendet werden
- Ausführliche Shell-Ausgaben
- Überlappende Grep-Ergebnisse, die das Modell nicht vollständig benötigt
Der Pre-Tool-Call-Hook führt RTK (Redundancy-aware Token Kompression) auf der Tool-Ausgabe aus, bevor sie Claude erreicht. Der Kompressionsprozess:
- Bereinigt wiederholte Abschnitte
- Entfernt Rauschen
- Fasst große Lesevorgänge zusammen
- Gibt die komprimierte Version an das Modell zurück
Leistungsergebnisse
Der Hook läuft in etwa 2,93 ms und fügt den Operationen keine spürbare Latenz hinzu. In der Praxis sehen Benutzer 40-66 % weniger Eingabe-Tokens in typischen Codierungssitzungen. Die Ausgabequalität des Modells bleibt unverändert, da die Kompression das Signal bewahrt, während Redundanz entfernt wird.
Diese Art der Optimierung ist besonders nützlich für Entwickler, die Claude Code intensiv nutzen, wo wiederholte Dateilesevorgänge und Tool-Ausgaben den Token-Verbrauch und die Kosten erheblich erhöhen können.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Erinnerung: Ein Persistent Memory MCP-Server für Claude Code
Recall ist ein Open-Source-MCP-Server, der Claude Code über Sitzungen hinweg persistenten Speicher durch semantische Suche mit Embeddings ermöglicht. Es umfasst vier Lebenszyklus-Hooks: session-start, observe, pre-compact und session-end.

Fehu: CLI-Doppelte Buchführung mit Claude AI MCP-Integration
Fehu ist ein leichtgewichtiges CLI-Personalfinanz-Tool, das über MCP mit Claude AI verbunden ist und die Erfassung von Transaktionen in natürlicher Sprache mit einem SQLite-basierten Doppelbuchungssystem ermöglicht. Es bietet hierarchische Konten, automatische Verschlagwortung mit Hashtags, eine leistungsstarke Berechnungs-Engine und Unterstützung für mehrere Währungen.

Mozilla Thunderbolt: Open-Source Enterprise-Client für KI auf selbst gehosteter Infrastruktur
Mozilla hat Thunderbolt angekündigt, einen Open-Source-AI-Client unter MPL-2.0-Lizenz, der Organisationen die Bereitstellung einer selbst gehosteten AI-Infrastruktur mit Modellauswahl, Integration von Unternehmensdaten und plattformübergreifenden nativen Anwendungen ermöglicht.

Werld: Offene künstliche Lebenssimulation mit sich entwickelnden neuronalen Netzen
Werld ist eine Echtzeit-Simulation künstlichen Lebens, bei der Agenten mit NEAT-Neuronalen Netzen ihre eigene neuronale Architektur, sensorische Verarbeitung und Verhaltensweisen entwickeln, ohne fest kodierte Regeln oder Belohnungsfunktionen. Die Simulation beginnt mit 30 Agenten auf einem Watts-Strogatz-Kleinstwelt-Graphen mit 64 sensorischen Kanälen, 7 kontinuierlichen Motorfunktionen und 29 vererbbaren Genommerkmalen.