Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines

✍️ OpenClawRadar📅 Veröffentlicht: 18. März 2026🔗 Source
Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines
Ad

Was ist Claw Compactor?

Claw Compactor ist eine Open-Source-LLM-Token-Komprimierungs-Engine, die auf einer 14-stufigen Fusion-Pipeline basiert. Jede Stufe ist ein spezialisierter Kompressor – von AST-basierter Codeanalyse über JSON-Statistik-Sampling bis hin zu Simhash-basierter Deduplizierung – die über eine unveränderliche Datenflussarchitektur verkettet sind, wobei die Ausgabe jeder Stufe in die nächste eingespeist wird.

Architekturdetails

Die Fusion-Pipeline umfasst diese Stufen:

  • QuantumLock → Cortex → Photon → RLE → SemanticDedup → Ionizer
  • LogCrunch → SearchCrunch → DiffCrunch → StructuralCollapse
  • Neurosyntax → Nexus → TokenOpt → Abbrev

Wichtige Designprinzipien:

  • Unveränderlicher Datenfluss – FusionContext ist eine eingefrorene Dataclass. Jede Stufe erzeugt ein neues FusionResult; nichts wird direkt verändert.
  • Gate-before-compress – Jede Stufe verfügt über eine should_apply()-Funktion, die Kontexttyp, Sprache und Rolle prüft, bevor Arbeit geleistet wird. Nicht anwendbare Stufen werden ohne Kosten übersprungen.
  • Inhaltsbewusstes Routing – Cortex erkennt automatisch den Inhaltstyp (Code, JSON, Protokolle, Diffs, Suchergebnisse) und die Sprache (Python, Go, Rust, TypeScript usw.), woraufhin nachgelagerte Stufen typbewusste Komprimierungsentscheidungen treffen.
  • Reversible Kompression – Ionizer speichert Originale in einem hash-adressierten RewindStore. Das LLM kann ein Tool aufrufen, um jeden komprimierten Abschnitt über seine Marker-ID abzurufen.
Ad

Benchmark-Ergebnisse

Echte Kompression (FusionEngine v7 vs Legacy Regex):

  • Python-Quellcode: 25,0 % Kompression (3,4-fache Verbesserung gegenüber Legacy)
  • JSON (100 Elemente): 81,9 % Kompression (6,5-fache Verbesserung)
  • Build-Protokolle: 24,1 % Kompression (4,4-fache Verbesserung)
  • Agenten-Konversation: 31,0 % Kompression (5,4-fache Verbesserung)
  • Git-Diff: 15,0 % Kompression (2,4-fache Verbesserung)
  • Suchergebnisse: 40,7 % Kompression (7,7-fache Verbesserung)
  • Gewichteter Durchschnitt: 53,9 % Kompression (5,9-fache Verbesserung)

SWE-bench Echte Aufgaben:

  • django__django-11620 (4,5K): 14,5 % Kompression
  • sympy__sympy-14396 (5,5K): 19,1 % Kompression
  • scikit-learn-25747 (11,8K): 15,9 % Kompression
  • scikit-learn-13554 (73K): 11,8 % Kompression
  • scikit-learn-25308 (81K): 14,4 % Kompression

vs LLMLingua-2 (ROUGE-L Fidelity):

  • Kompression 0,3 (aggressiv): Claw Compactor 0,653 vs LLMLingua-2 0,346 (+88,2 %)
  • Kompression 0,5 (ausgewogen): Claw Compactor 0,723 vs LLMLingua-2 0,570 (+26,8 %)

Schnellstart

git clone https://github.com/open-compress/claw-compactor.git
cd claw-compactor
# Benchmark Ihres Arbeitsbereichs (nicht-destruktiv)
python3 scripts/mem_compress.py /path/to/workspace benchmark
# Vollständige Komprimierungspipeline
python3 scripts/mem_compress.py /path/to/workspace full

Anforderungen: Python 3.9+. Optional: pip install tiktoken für genaue Token-Zählungen.

API-Nutzung

from scripts.lib.fusion.engine import FusionEngine

engine = FusionEngine() result = engine.compress( text="def hello(): \n # greeting function \n print('hello')", content_type="code", # oder Cortex automatisch erkennen lassen language="python", # optionaler Hinweis ) print(result["compressed"]) # komprimierte Ausgabe print(result["stats"]) # Statistiken pro Stufe

📖 Read the full source: HN LLM Tools

Ad

👀 Siehe auch

Pilot: Ein Browser-Automatisierungstool, vollständig mit Claude Code erstellt
Werkzeuge

Pilot: Ein Browser-Automatisierungstool, vollständig mit Claude Code erstellt

Ein Nicht-Entwickler nutzte Claude Code, um Pilot zu erstellen, ein Chrome-Automatisierungstool, das KI ermöglicht, Browser über die Navigation im Barrierefreiheitsbaum zu steuern. Das Tool weist klickbaren Elementen Nummern zu, sodass Claude Befehle wie 'click 5' ausgeben kann, anstatt Bildschirmpositionen zu erraten.

OpenClawRadar
Claude Code fügt Fernsteuerungsfunktion für die Verwaltung mobiler Sitzungen hinzu
Werkzeuge

Claude Code fügt Fernsteuerungsfunktion für die Verwaltung mobiler Sitzungen hinzu

Claude Code ermöglicht es Entwicklern nun, Aufgaben in ihrem Terminal zu starten und Sitzungen von mobilen Geräten aus über die Claude-App oder claude.ai/code weiter zu steuern, während Claude lokal auf ihrem Computer läuft.

OpenClawRadar
civStation: Ein VLM-System zum Spielen von Civilization VI über natürliche Sprachbefehle
Werkzeuge

civStation: Ein VLM-System zum Spielen von Civilization VI über natürliche Sprachbefehle

civStation ist ein VLM-System zur Computernutzung, das Civilization VI spielt, indem es hochrangige natürliche Sprachbefehle in Spielaktionen übersetzt. Das System verwendet eine 3-Schichten-Architektur, die Strategie und Ausführung trennt, mit Unterstützung für menschliche Eingriffe.

OpenClawRadar
Open-Source-Claude-Code-Nachimplementierung mit Patch für lokale Modellkompatibilität
Werkzeuge

Open-Source-Claude-Code-Nachimplementierung mit Patch für lokale Modellkompatibilität

Ein Entwickler hat die Open-Source-Nachimplementierung von Claude Code gepatcht, um sie mit Ollama und lokalen Modellen kompatibel zu machen, indem er fest kodierte Anthropic-Client-Abhängigkeiten entfernt hat. Die CLI erkennt nun automatisch Anbieter anhand von Modellnamen und Umgebungsvariablen.

OpenClawRadar