Context Gateway: Open-Source Proxy zur Kontext-Komprimierung

Was Context Gateway tut

Context Gateway ist ein agentenbasierter Proxy, der zwischen KI-Coding-Agenten (wie Claude Code, OpenClaw oder Cursor) und der LLM-API sitzt. Wenn Tool-Ausgaben wie Dateilesevorgänge oder grep-Ergebnisse Tausende von Tokens in das Kontextfenster einfüllen, komprimiert der Proxy diesen Inhalt, bevor er den LLM erreicht. Die Motivation stammt aus Forschungen, die zeigen, dass Benchmarks für lange Kontexte starke Genauigkeitseinbußen erfahren, wenn der Kontext wächst – die Auswertung von OpenAIs GPT-5.4 soll laut Berichten von 97,2% bei 32k Tokens auf 36,6% bei 1M Tokens fallen.

Wie die Komprimierung funktioniert

Das System verwendet kleine Sprachmodelle (SLMs), die Modellinterna untersuchen und Klassifikatoren trainieren, um zu erkennen, welche Teile des Kontexts das stärkste Signal tragen. Wenn ein Tool eine Ausgabe zurückgibt, erfolgt die Komprimierung bedingt durch die Absicht des Tool-Aufrufs. Wenn beispielsweise ein Agent grep aufgerufen hat, um Fehlerbehandlungsmuster zu suchen, behält das SLM relevante Übereinstimmungen bei und entfernt den Rest. Falls das Modell später etwas benötigt, das entfernt wurde, kann es expand() aufrufen, um die ursprüngliche Ausgabe abzurufen.

Wichtige Funktionen und Einrichtung

Hintergrundkomprimierung: Wird bei 85% Fensterkapazität ausgelöst, mit vorberechneten Zusammenfassungen, sodass Sie nicht auf die Komprimierung warten müssen
Lazy-Load-Tool-Beschreibungen: Das Modell sieht nur Tools, die für den aktuellen Schritt relevant sind
Ausgabenobergrenzen: Kosten mit Budgetlimits kontrollieren
Dashboard: Laufende und vergangene Sitzungen verfolgen
Slack-Benachrichtigungen: Werden benachrichtigt, wenn ein Agent auf Sie wartet
Unterstützte Agenten: Claude Code, Cursor, OpenClaw oder benutzerdefinierte Konfigurationen

Erste Schritte

Installieren mit:

curl -fsSL https://compresr.ai/api/install | sh

Dann führen Sie context-gateway aus, um einen interaktiven TUI-Assistenten zu starten, der Ihnen hilft:

Einen Agenten auswählen (claude_code, cursor, openclaw oder benutzerdefiniert)
Konfiguration erstellen/bearbeiten, einschließlich Zusammenfassungsmodell und API-Schlüssel
Slack-Benachrichtigungen bei Bedarf aktivieren
Auslöseschwelle für Komprimierung festlegen (Standard: 75%)

Das Tool ist Open-Source, hauptsächlich in Go (90,9%) entwickelt und wird von Compresr, einem YC-unterstützten Unternehmen, gewartet. Sie können Komprimierungsprotokolle unter logs/history_compaction.jsonl einsehen, um zu sehen, was im Hintergrund passiert.

📖 Read the full source: HN LLM Tools

Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext

Was Context Gateway tut

Wie die Komprimierung funktioniert

Wichtige Funktionen und Einrichtung

Erste Schritte

👀 Siehe auch

Mozilla Thunderbolt: Open-Source Enterprise-Client für KI auf selbst gehosteter Infrastruktur

Claude Code Mastery: Open-Source-Konfigurationssystem fügt persistenter Speicher und kuratierte Fähigkeiten zur Claude Code CLI hinzu

OpenClaws Atoship-Fähigkeit verwandelt den KI-Assistenten in einen Versandmanager.

Open-Source-Vertrauensbewertungs-Hook für Claude Code überwacht Sitzungen, blockiert geschützte Pfade