Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext

Was Context Gateway tut
Context Gateway ist ein agentenbasierter Proxy, der zwischen KI-Coding-Agenten (wie Claude Code, OpenClaw oder Cursor) und der LLM-API sitzt. Wenn Tool-Ausgaben wie Dateilesevorgänge oder grep-Ergebnisse Tausende von Tokens in das Kontextfenster einfüllen, komprimiert der Proxy diesen Inhalt, bevor er den LLM erreicht. Die Motivation stammt aus Forschungen, die zeigen, dass Benchmarks für lange Kontexte starke Genauigkeitseinbußen erfahren, wenn der Kontext wächst – die Auswertung von OpenAIs GPT-5.4 soll laut Berichten von 97,2% bei 32k Tokens auf 36,6% bei 1M Tokens fallen.
Wie die Komprimierung funktioniert
Das System verwendet kleine Sprachmodelle (SLMs), die Modellinterna untersuchen und Klassifikatoren trainieren, um zu erkennen, welche Teile des Kontexts das stärkste Signal tragen. Wenn ein Tool eine Ausgabe zurückgibt, erfolgt die Komprimierung bedingt durch die Absicht des Tool-Aufrufs. Wenn beispielsweise ein Agent grep aufgerufen hat, um Fehlerbehandlungsmuster zu suchen, behält das SLM relevante Übereinstimmungen bei und entfernt den Rest. Falls das Modell später etwas benötigt, das entfernt wurde, kann es expand() aufrufen, um die ursprüngliche Ausgabe abzurufen.
Wichtige Funktionen und Einrichtung
- Hintergrundkomprimierung: Wird bei 85% Fensterkapazität ausgelöst, mit vorberechneten Zusammenfassungen, sodass Sie nicht auf die Komprimierung warten müssen
- Lazy-Load-Tool-Beschreibungen: Das Modell sieht nur Tools, die für den aktuellen Schritt relevant sind
- Ausgabenobergrenzen: Kosten mit Budgetlimits kontrollieren
- Dashboard: Laufende und vergangene Sitzungen verfolgen
- Slack-Benachrichtigungen: Werden benachrichtigt, wenn ein Agent auf Sie wartet
- Unterstützte Agenten: Claude Code, Cursor, OpenClaw oder benutzerdefinierte Konfigurationen
Erste Schritte
Installieren mit:
curl -fsSL https://compresr.ai/api/install | sh
Dann führen Sie context-gateway aus, um einen interaktiven TUI-Assistenten zu starten, der Ihnen hilft:
- Einen Agenten auswählen (claude_code, cursor, openclaw oder benutzerdefiniert)
- Konfiguration erstellen/bearbeiten, einschließlich Zusammenfassungsmodell und API-Schlüssel
- Slack-Benachrichtigungen bei Bedarf aktivieren
- Auslöseschwelle für Komprimierung festlegen (Standard: 75%)
Das Tool ist Open-Source, hauptsächlich in Go (90,9%) entwickelt und wird von Compresr, einem YC-unterstützten Unternehmen, gewartet. Sie können Komprimierungsprotokolle unter logs/history_compaction.jsonl einsehen, um zu sehen, was im Hintergrund passiert.
📖 Read the full source: HN LLM Tools
👀 Siehe auch

Mozilla Thunderbolt: Open-Source Enterprise-Client für KI auf selbst gehosteter Infrastruktur
Mozilla hat Thunderbolt angekündigt, einen Open-Source-AI-Client unter MPL-2.0-Lizenz, der Organisationen die Bereitstellung einer selbst gehosteten AI-Infrastruktur mit Modellauswahl, Integration von Unternehmensdaten und plattformübergreifenden nativen Anwendungen ermöglicht.

Claude Code Mastery: Open-Source-Konfigurationssystem fügt persistenter Speicher und kuratierte Fähigkeiten zur Claude Code CLI hinzu
Claude Code Mastery ist ein Open-Source-Konfigurationssystem, das persistente Speicherung über Sitzungen hinweg, intelligente Lebenszyklus-Hooks und 26+ kuratierte Fähigkeiten zur Claude Code CLI hinzufügt. Es umfasst eine 6-Dateien-Memory-Bank pro Projekt, einen Zero-Config-Launcher und plattformübergreifende Unterstützung.

OpenClaws Atoship-Fähigkeit verwandelt den KI-Assistenten in einen Versandmanager.
Die atoship-Fähigkeit für OpenClaw ermöglicht es Nutzern, ihre Versandanforderungen in einfachem Englisch zu beschreiben und übernimmt dann die Auswahl des Transportunternehmens, Preisvergleiche, den Kauf von Etiketten und die Sendungsverfolgung. Beispielbefehle sind 'versende diese 1-Pfund-Box nach New York, günstigste Option'.

Open-Source-Vertrauensbewertungs-Hook für Claude Code überwacht Sitzungen, blockiert geschützte Pfade
Ein Entwickler hat einen Python-Hook erstellt, der jede Claude-Code-Sitzung in den Dimensionen Zuverlässigkeit, Umfang und Kosten bewertet, den Zugriff auf geschützte Pfade wie .env-Dateien blockiert und Ereignisse per Hash-Kette zur Manipulationserkennung verknüpft. Das Einzeldatei-Tool ist auf GitHub verfügbar.