Kontextmodus: Ein MCP-Server, der Tool-Ausgaben für Claude Code komprimiert

Was Context Mode bewirkt
Context Mode löst das Problem, bei dem jeder MCP-Tool-Aufruf in Claude Code Rohdaten in das 200K-Kontextfenster einfügt. Beispiele aus der Quelle zeigen, dass ein Playwright-Snapshot 56 KB kostet, zwanzig GitHub-Issues 59 KB und ein Zugriffslog 45 KB. Nach 30 Minuten können 40 % Ihres Kontexts verloren sein.
Der MCP-Server sitzt zwischen Claude Code und diesen Ausgaben, verarbeitet sie in Sandboxes, sodass nur Zusammenfassungen das Modell erreichen. Er erreicht eine 98 %ige Reduktion der Kontextnutzung (315 KB werden zu 5,4 KB).
Installation und Einrichtung
Einzeilige Installation:
/plugin marketplace add mksglu/claude-context-mode
/plugin install context-mode@claude-context-modeOder über CLI:
claude mcp add context-mode -- npx -y context-modeDie Installation umfasst eine Auto-Routing-Fähigkeit, die große Ausgaben automatisch durch Context Mode leitet, plus einen PreToolUse-Hook, der Context-Mode-Routing in Subagent-Prompts injiziert. Kein Prompting erforderlich.
Verfügbare Tools
batch_execute: Mehrere Befehle + mehrere Suchanfragen in EINEM Aufruf ausführen (986 KB → 62 KB)execute: Code in 10 Sprachen ausführen. Nur stdout gelangt in den Kontext (56 KB → 299 B)execute_file: Dateien in Sandbox verarbeiten. Rohinhalte verlassen diese nie (45 KB → 155 B)index: Markdown in FTS5 mit BM25-Ranking chunkern (60 KB → 40 B)search: Indizierte Inhalte mit mehreren Abfragen in einem Aufruf durchsuchen (On-Demand-Retrieval)fetch_and_index: URL abrufen, zu Markdown konvertieren, indizieren (60 KB → 40 B)stats: Sitzungs-Token-Tracking mit Tool-spezifischer Aufschlüsselung
Technische Umsetzung
Jeder execute-Aufruf startet einen isolierten Subprozess mit eigener Prozessgrenze. Skripte können nicht auf Speicher oder Zustand anderer zugreifen. Der Subprozess führt Ihren Code aus, erfasst stdout, und nur dieser stdout gelangt in den Konversationskontext. Die Rohdaten – Logdateien, API-Antworten, Snapshots – verlassen die Sandbox nie.
Zehn Sprachlaufzeiten sind verfügbar: JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl, R. Bun wird automatisch erkannt für 3-5x schnellere JS/TS-Ausführung.
Authentifizierte CLIs funktionieren über Credential-Passthrough – gh, aws, gcloud, kubectl, docker erben Umgebungsvariablen und Konfigurationspfade, ohne sie der Konversation preiszugeben.
Wenn die Ausgabe 5 KB überschreitet und eine Absicht angegeben ist, schaltet Context Mode auf absichtsgesteuerte Filterung um: Es indiziert die vollständige Ausgabe in die Wissensdatenbank, sucht nach Abschnitten, die Ihrer Absicht entsprechen, und gibt nur die relevanten Treffer mit einem Vokabular durchsuchbarer Begriffe für Folgefragen zurück.
Die Wissensdatenbank nutzt SQLite FTS5 (Full-Text Search 5) virtuelle Tabellen. Das index-Tool chunkert Markdown-Inhalte nach Überschriften, während Codeblöcke intakt bleiben, und speichert sie. Die Suche verwendet BM25-Ranking – einen probabilistischen Relevanzalgorithmus, der Dokumente basierend auf Termhäufigkeit, inverser Dokumenthäufigkeit und Dokumentlänge bewertet.
📖 Read the full source: HN AI Agents
👀 Siehe auch

Open-Source-AI-Speicher für NodeJS-Projekte
Mind Palace ist ein Open-Source-Speicher- und Abrufsystem für NodeJS, das Informationen über LLM-Chat-Sitzungen hinweg speichert. Es unterstützt wichtige LLMs und Vektorspeicher, extrahiert automatisch Erinnerungen aus Interaktionen und wandelt sie in Vektoren um.

Pilot Shell: Eine strukturierte Workflow-Schicht für Claude Code
Pilot Shell fügt spezifikationsgesteuerte TDD-Workflows, Qualitäts-Hooks, Context Engineering und Token-Optimierung auf Basis von Claude Code hinzu – ohne die Komplexität von Multi-Agenten-Frameworks.

Reddit-Nutzer teilt KI-Tool zum Abrufen von Kontoständen.
Ein Reddit-Beitrag auf r/openclaw stellt einen KI-Agenten vor, der darauf abzielt, die Sammlung von Kontoständen zu automatisieren, indem er Python nutzt. Die Nutzer diskutieren das Automatisierungspotenzial durch maßgeschneiderte Skripte, die APIs wie Plaid verwenden.

EvalShift: Open-Source-CLI zur Erkennung von LLM-Regressionen bei der Modellmigration
EvalShift ist ein MIT-lizenziertes Python-CLI, das Ausgaben von Quell- vs. Ziel-LLMs über Prompts, Agents und Tool-Calling-Workflows vergleicht und einen lokalen HTML-Regressionsbericht erstellt.