Verwendung des MCP-Code-Modus für effiziente Claude-Schlüsselwortrecherche

Architektur und Token-Effizienz
Ein Entwickler teilte seine Erfahrungen beim Aufbau eines MCP-Servers, der Claude autonome Keyword-Recherche-Fähigkeiten verleiht. Die größte technische Herausforderung war die Token-Effizienz – traditionelle MCP-Server mit 15-20 Tools können Tausende von Tokens allein für Tool-Definitionen verbrauchen, bevor überhaupt echte Arbeit beginnt.
Sie implementierten das Code-Modus-Muster (denselben Ansatz, den Cloudflare für seine API open-sourcete), um dies auf etwa 1.000 Tokens mit nur zwei Tools zu reduzieren: search und execute.
Wie der Code-Modus funktioniert
Anstatt ein Tool pro API-Endpunkt zu erstellen, schreibt der Agent JavaScript-Snippets gegen die OpenAPI-Spezifikation. Dieser Code läuft in einer sandboxed VM mit einem Null-Prototyp-Kontext. Der API-Schlüssel wird serverseitig injiziert und gelangt nie in den Kontext des Agents. Weiterleitungen werden blockiert, um Token-Exfiltration zu verhindern.
Fähigkeiten in der Praxis
Mit diesem Setup kann Claude nun:
- Keywords analysieren (Volumen, CPC, Schwierigkeit, Absicht)
- Trendsignale erkennen (Ausbruch, Spitze, saisonale Muster)
- 350+ verwandte Keywords pro Abfrage erhalten
- Mehrere API-Aufrufe in einer einzigen Tool-Aufrufkette verketten
Wesentliche Vorteile
Der größte Vorteil ist die Komponierbarkeit. Der Agent kann die Spezifikation durchsuchen, um Endpunkte zu entdecken, und dann mehrstufige Workflows ohne vordefinierte Tool-Ketten ausführen. Dieser Ansatz ermöglicht einen flexibleren und autonomen Betrieb im Vergleich zu traditionellen Architekturen mit einem Tool pro Endpunkt.
Der Entwickler ist neugierig, ob andere MCP-Server mit Code-Modus bauen oder ob der traditionelle Ansatz für verschiedene Anwendungsfälle besser funktioniert.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch
Nadel: Ein 26M-Parameter-Funktionsaufrufmodell mit 6000 Tok/s auf Mobilgeräten
Cactus veröffentlicht Needle als Open Source, ein 26M-Parameter-Modell für einmaligen Funktionsaufruf, das 6000 tok/s Prefill und 1200 tok/s Decoding auf Verbrauchergeräten erreicht. Es basiert auf Simple Attention Networks (ohne FFNs) und übertrifft mehrere größere Modelle in Tool-Use-Benchmarks.

KI-Sandbox-Manager: LXC-basierte Sandbox für Codex mit GPU-Durchleitung und Computernutzung auf headless Linux
ai-sandbox-manager ist eine Open-Source-LXC-Sandbox für Codex-Agenten auf headless Linux. Sie bietet GPU-Durchleitung, vollständigen sudo-Zugriff, persistente Umgebungen und Computernutzung via CUA, während sie den Agenten vom Host-Betriebssystem isoliert.

Obsidian-Integration für Persistent Memory in OpenClaw und Claude Code
Ein Reddit-Nutzer demonstriert, wie die Verbindung von OpenClaw und Claude Code mit einem Obsidian-Vault persistente Langzeiterinnerung über Sitzungen hinweg schafft. Das Setup verknüpft automatisch Erinnerungen, Kontext, Projektdateien und Notizen, wobei alle Instanzen bei Bedarf auf den gemeinsamen Speicher zugreifen können.

engram: Claude-Speicher-Plugin mit salienzgesteuertem Erfassen und Traumzyklen
engram ist ein Claude-Speicher-Plugin, das Beobachtungen zur Erfassungszeit anhand von 5 Salienz-Dimensionen filtert und nur hoch bewertete Ereignisse in SQLite speichert, ohne LLM-Aufrufe für die Bewertung. Es verfügt über automatische Einbindung durch 5 Hooks und Traumzyklen, die wiederkehrende Arbeitsabläufe am Ende einer Sitzung extrahieren.