Claude Code ToolSearch: Token sparen mit Lazy Loading

Eine Reddit-Analyse des System-Prompts von Claude Code zeigt, dass Tools lazy-geladen werden, um den Token-Verbrauch zu senken. Statt das vollständige Schema jedes Tools mit jeder Anfrage zu senden, sendet Claude Code eine Liste der Tool-Namen in einem <system-reminder>-Tag und weist das Modell an, zuerst ToolSearch aufzurufen, um das Schema für jedes Tool zu laden.

Wie es funktioniert

Der System-Prompt enthält eine Anweisung wie diese:

<system-reminder>
Die folgenden zurückgestellten Tools sind jetzt über ToolSearch verfügbar. Ihre Schemata sind NICHT geladen – ein direkter Aufruf führt zu einem InputValidationError. Verwenden Sie ToolSearch mit der Abfrage "select:<name>[,<name>...]", um die Tool-Schemata vor dem Aufruf zu laden:

AskUserQuestion CronCreate CronDelete CronList EnterPlanMode EnterWorktree ExitPlanMode ExitWorktree Monitor NotebookEdit PushNotification RemoteTrigger TaskOutput TaskStop TodoWrite WebFetch WebSearch
[+ ~130 MCP-Tools (Slack, Notion, Gmail...)]
</system-reminder>

Der <system-reminder> wird nur in der ersten Benutzernachricht des Gesprächs eingefügt. Ein ähnlicher Block listet Fähigkeiten mit einzeiligen Beschreibungen auf.

Auswirkungen auf den Token-Verbrauch

Laut dem Beitrag verbrauchten die Systemanweisungen zusammen mit den Erinnerungen bei einer einfachen Testnachricht mit "hi" bereits 38k Tokens. Das vollständige Laden aller Tool-Schemata würde diesen Verbrauch drastisch erhöhen – daher der Ansatz des verzögerten Ladens.

Praktische Implikationen

Wenn Sie auf Claude Code oder ähnlichen agentenbasierten Systemen aufbauen, lohnt es sich, dieses Muster zu übernehmen:

Verschieben Sie Schemata für selten genutzte Tools, bis sie benötigt werden.
Verwenden Sie einen ToolSearch-ähnlichen Befehl, um explizit Schemata anzufordern.
Halten Sie Erinnerungen innerhalb der ersten Nachricht, um Kontextwiederholungen zu vermeiden.

Das bedeutet auch, dass Sie beim Schreiben benutzerdefinierter Tools für Claude Code sicherstellen müssen, dass das Modell sie über ToolSearch finden kann – sonst sind sie unsichtbar oder verursachen Validierungsfehler.

📖 Read the full source: r/ClaudeAI

Claude Code lädt Tool-Schemata per ToolSearch lazy, um Token zu sparen

Wie es funktioniert

Auswirkungen auf den Token-Verbrauch

Praktische Implikationen

👀 Siehe auch

Kontext-Gateway: Ein Open-Source-Proxy zur Komprimierung von KI-Agenten-Kontext

Session Inspector für Claude Code bietet Echtzeit-Einblicke in die Abläufe von KI-Agenten.

LORE.md: Ein offener Standard zur Extraktion strukturierten Wissens aus KI-Konversationen

Quanta-SDK v0.9.2 fügt einen MCP-Server für die Ausführung von Quantenschaltkreisen über KI-Agenten hinzu.