Claude Code lädt Tool-Schemata per ToolSearch lazy, um Token zu sparen

✍️ OpenClawRadar📅 Veröffentlicht: 28. April 2026🔗 Source
Claude Code lädt Tool-Schemata per ToolSearch lazy, um Token zu sparen
Ad

Eine Reddit-Analyse des System-Prompts von Claude Code zeigt, dass Tools lazy-geladen werden, um den Token-Verbrauch zu senken. Statt das vollständige Schema jedes Tools mit jeder Anfrage zu senden, sendet Claude Code eine Liste der Tool-Namen in einem <system-reminder>-Tag und weist das Modell an, zuerst ToolSearch aufzurufen, um das Schema für jedes Tool zu laden.

Wie es funktioniert

Der System-Prompt enthält eine Anweisung wie diese:

<system-reminder>
Die folgenden zurückgestellten Tools sind jetzt über ToolSearch verfügbar. Ihre Schemata sind NICHT geladen – ein direkter Aufruf führt zu einem InputValidationError. Verwenden Sie ToolSearch mit der Abfrage "select:<name>[,<name>...]", um die Tool-Schemata vor dem Aufruf zu laden:

AskUserQuestion CronCreate CronDelete CronList EnterPlanMode EnterWorktree ExitPlanMode ExitWorktree Monitor NotebookEdit PushNotification RemoteTrigger TaskOutput TaskStop TodoWrite WebFetch WebSearch

[+ ~130 MCP-Tools (Slack, Notion, Gmail...)] </system-reminder>

Der <system-reminder> wird nur in der ersten Benutzernachricht des Gesprächs eingefügt. Ein ähnlicher Block listet Fähigkeiten mit einzeiligen Beschreibungen auf.

Ad

Auswirkungen auf den Token-Verbrauch

Laut dem Beitrag verbrauchten die Systemanweisungen zusammen mit den Erinnerungen bei einer einfachen Testnachricht mit "hi" bereits 38k Tokens. Das vollständige Laden aller Tool-Schemata würde diesen Verbrauch drastisch erhöhen – daher der Ansatz des verzögerten Ladens.

Praktische Implikationen

Wenn Sie auf Claude Code oder ähnlichen agentenbasierten Systemen aufbauen, lohnt es sich, dieses Muster zu übernehmen:

  • Verschieben Sie Schemata für selten genutzte Tools, bis sie benötigt werden.
  • Verwenden Sie einen ToolSearch-ähnlichen Befehl, um explizit Schemata anzufordern.
  • Halten Sie Erinnerungen innerhalb der ersten Nachricht, um Kontextwiederholungen zu vermeiden.

Das bedeutet auch, dass Sie beim Schreiben benutzerdefinierter Tools für Claude Code sicherstellen müssen, dass das Modell sie über ToolSearch finden kann – sonst sind sie unsichtbar oder verursachen Validierungsfehler.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext
Werkzeuge

Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext

Context Gateway ist ein Open-Source-Proxy, der zwischen Coding-Agenten und LLMs sitzt und Tool-Ausgaben komprimiert, bevor sie in das Kontextfenster gelangen. Es verwendet kleine Sprachmodelle, um Signale im Kontext zu erkennen, führt Hintergrundkomprimierung bei 85% Fensterkapazität durch und beinhaltet Ausgabenobergrenzen, ein Dashboard und Slack-Benachrichtigungen.

OpenClawRadar
Session Inspector für Claude Code bietet Echtzeit-Einblicke in die Abläufe von KI-Agenten.
Werkzeuge

Session Inspector für Claude Code bietet Echtzeit-Einblicke in die Abläufe von KI-Agenten.

Vibeyard, eine Open-Source-Terminal-IDE, die Claude Code einbindet, hat eine Session Inspector-Funktion hinzugefügt, die Echtzeit-Einblicke in Claude Code-Sitzungen mit Zeitachsenverfolgung, Kostenaufschlüsselung, Tool-Analysen und Kontextfensterüberwachung bietet.

OpenClawRadar
LORE.md: Ein offener Standard zur Extraktion strukturierten Wissens aus KI-Konversationen
Werkzeuge

LORE.md: Ein offener Standard zur Extraktion strukturierten Wissens aus KI-Konversationen

LORE.md ist ein offener Standard zur Extraktion strukturierten Wissens aus KI-Gesprächen, der speziell dafür entwickelt wurde, das Problem zu lösen, dass wertvolle Erkenntnisse in Chat-Protokollen verloren gehen. Der Standard definiert ein strukturiertes Format, das das dauerhafte Wissen aus jedem KI-Gespräch erfasst.

OpenClawRadar
Quanta-SDK v0.9.2 fügt einen MCP-Server für die Ausführung von Quantenschaltkreisen über KI-Agenten hinzu.
Werkzeuge

Quanta-SDK v0.9.2 fügt einen MCP-Server für die Ausführung von Quantenschaltkreisen über KI-Agenten hinzu.

Quanta-SDK v0.9.2 enthält jetzt einen MCP-Server (Model Context Protocol), der KI-Agenten wie Claude oder GPT Werkzeuge zur Ausführung und Interpretation von Quantenschaltkreisen bereitstellt. Der Server bietet über 20 Werkzeuge, darunter Schaltkreisausführung auf IBM-Hardware, Ergebnisinterpretation, Rauschanalyse und quantenbasierte Finanzpreisgestaltung.

OpenClawRadar