Kontext-os: Open-Source-Tool reduziert den Tokenverbrauch von Claude Code um 27–42 %

context-os ist ein Open-Source-Lokalkontextoptimierer, der sich automatisch in Claude Code einklinkt, um den Tokenverbrauch zu reduzieren. Das Tool wurde entwickelt, nachdem Nutzungslimits zu häufig erreicht wurden.
Einrichtung und Installation
Einzeilige Einrichtung: cargo install --path apps/cli gefolgt von context-os init.
Funktionen
- Der PreToolUse-Hook fängt Befehle wie cargo test, npm build, cargo clippy, pytest und ähnliche ab und komprimiert die Ausgabe, bevor Claude sie sieht
- Speichert den Sitzungszustand automatisch beim Stoppen – die nächste Sitzung lädt Ihr Ziel, Git-Status, geänderte Dateien, Entscheidungen und fehlgeschlagene Ansätze
- Fügt bei jeder Eingabe kompakten Kontext (Branch, unbestätigte Dateien, Ziel) ein, sodass Claude immer weiß, wo es steht, selbst nach Komprimierung
Leistung und Spezifikationen
- 27-42% Reduktion des Tokenverbrauchs je nach Inhaltstyp
- 7/7 Gates in Benchmarks bestanden
- 100% geschützte String-Wiederherstellung
- Einzelne Rust-Binärdatei
- Keine Cloud, keine Netzwerkaufrufe
Das Tool behebt nicht das Ratenlimitsystem selbst, reduziert aber messbar, wie viele Token Sie pro Sitzung für aufgeblähte Werkzeugausgaben verbrauchen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Mengram AI: Automatisches Speicher-Tool für Claude-Code-Sitzungen
Mengram AI erhält automatisch den Kontext zwischen Claude Code-Sitzungen aufrecht, indem es kognitive Profile lädt, relevante vergangene Kontexte in Prompts einfügt und neues Wissen speichert. Es speichert semantisches, episodisches und prozedurales Gedächtnis, das sich basierend auf Fehlern weiterentwickelt.

Token Enhancer reduziert den Tokenverbrauch von Webseiten für KI-Agenten.
Ein Entwickler stellte fest, dass rohes HTML von Webabrufen übermäßig viele Tokens im KI-Agenten-Kontext verbraucht, wobei Yahoo-Finance-Seiten 704.000 Tokens verwendeten. Durch den Einsatz von Token Enhancer als MCP-Server konnte dies auf 2.600 Tokens reduziert werden.
MartinLoop: Open-Source-Steuerungsebene für KI-Coding-Agenten mit Budgetgrenzen und Prüfpfaden
MartinLoop ist eine Open-Source-Steuerungsebene für KI-Coding-Agenten, die harte Budgetstopps, JSONL-Audit-Trails, Fehlerklassifizierung und testverifizierte Abschlussprüfungen hinzufügt.

Skillware ergänzt um einen synthetischen Datengenerator mit Entropiebewertung für lokales Modell-Fine-Tuning.
Skillware hat einen neuen synthetischen Datengenerator-Skill veröffentlicht, der zlib-Kompressionsverhältnis-Heuristiken nutzt, um die Ausgabevielfalt zu bewerten und so Modellkollaps vorzubeugen. Das Tool funktioniert sofort mit Ollama, unterstützt Gemini/Anthropic für hochwertige Reasoning-Batches und gibt JSON-Batches für .jsonl-Fine-Tuning-Pipelines aus.