Kontextmodus: Ein MCP-Server, der Tool-Ausgaben für Claude Code komprimiert

✍️ OpenClawRadar📅 Veröffentlicht: 25. Februar 2026🔗 Source
Kontextmodus: Ein MCP-Server, der Tool-Ausgaben für Claude Code komprimiert
Ad

Was Context Mode bewirkt

Context Mode löst das Problem, bei dem jeder MCP-Tool-Aufruf in Claude Code Rohdaten in das 200K-Kontextfenster einfügt. Beispiele aus der Quelle zeigen, dass ein Playwright-Snapshot 56 KB kostet, zwanzig GitHub-Issues 59 KB und ein Zugriffslog 45 KB. Nach 30 Minuten können 40 % Ihres Kontexts verloren sein.

Der MCP-Server sitzt zwischen Claude Code und diesen Ausgaben, verarbeitet sie in Sandboxes, sodass nur Zusammenfassungen das Modell erreichen. Er erreicht eine 98 %ige Reduktion der Kontextnutzung (315 KB werden zu 5,4 KB).

Installation und Einrichtung

Einzeilige Installation:

/plugin marketplace add mksglu/claude-context-mode
/plugin install context-mode@claude-context-mode

Oder über CLI:

claude mcp add context-mode -- npx -y context-mode

Die Installation umfasst eine Auto-Routing-Fähigkeit, die große Ausgaben automatisch durch Context Mode leitet, plus einen PreToolUse-Hook, der Context-Mode-Routing in Subagent-Prompts injiziert. Kein Prompting erforderlich.

Verfügbare Tools

  • batch_execute: Mehrere Befehle + mehrere Suchanfragen in EINEM Aufruf ausführen (986 KB → 62 KB)
  • execute: Code in 10 Sprachen ausführen. Nur stdout gelangt in den Kontext (56 KB → 299 B)
  • execute_file: Dateien in Sandbox verarbeiten. Rohinhalte verlassen diese nie (45 KB → 155 B)
  • index: Markdown in FTS5 mit BM25-Ranking chunkern (60 KB → 40 B)
  • search: Indizierte Inhalte mit mehreren Abfragen in einem Aufruf durchsuchen (On-Demand-Retrieval)
  • fetch_and_index: URL abrufen, zu Markdown konvertieren, indizieren (60 KB → 40 B)
  • stats: Sitzungs-Token-Tracking mit Tool-spezifischer Aufschlüsselung
Ad

Technische Umsetzung

Jeder execute-Aufruf startet einen isolierten Subprozess mit eigener Prozessgrenze. Skripte können nicht auf Speicher oder Zustand anderer zugreifen. Der Subprozess führt Ihren Code aus, erfasst stdout, und nur dieser stdout gelangt in den Konversationskontext. Die Rohdaten – Logdateien, API-Antworten, Snapshots – verlassen die Sandbox nie.

Zehn Sprachlaufzeiten sind verfügbar: JavaScript, TypeScript, Python, Shell, Ruby, Go, Rust, PHP, Perl, R. Bun wird automatisch erkannt für 3-5x schnellere JS/TS-Ausführung.

Authentifizierte CLIs funktionieren über Credential-Passthrough – gh, aws, gcloud, kubectl, docker erben Umgebungsvariablen und Konfigurationspfade, ohne sie der Konversation preiszugeben.

Wenn die Ausgabe 5 KB überschreitet und eine Absicht angegeben ist, schaltet Context Mode auf absichtsgesteuerte Filterung um: Es indiziert die vollständige Ausgabe in die Wissensdatenbank, sucht nach Abschnitten, die Ihrer Absicht entsprechen, und gibt nur die relevanten Treffer mit einem Vokabular durchsuchbarer Begriffe für Folgefragen zurück.

Die Wissensdatenbank nutzt SQLite FTS5 (Full-Text Search 5) virtuelle Tabellen. Das index-Tool chunkert Markdown-Inhalte nach Überschriften, während Codeblöcke intakt bleiben, und speichert sie. Die Suche verwendet BM25-Ranking – einen probabilistischen Relevanzalgorithmus, der Dokumente basierend auf Termhäufigkeit, inverser Dokumenthäufigkeit und Dokumentlänge bewertet.

📖 Read the full source: HN AI Agents

Ad

👀 Siehe auch