MCP-Kontextaufblähung: Echte Kosten und eine praktische Lösung für Claude-Code-Nutzer

Ein Reddit-Nutzer, der vier Monate lang 9 MCP-Server in Claude Code betrieben hat, beschrieb detailliert die versteckten Kosten und Leistungseinbußen, die er erlebte, sowie eine konkrete Lösung. Der Beitrag ist ein Muss für alle, die MCP in der Produktion einsetzen.
Die Rechnung
Mit 9 Servern (Dateisystem, GitHub, Stripe, Linear, Notion, Postgres, Sentry, AWS und benutzerdefiniert), die insgesamt 142 Tools bereitstellen, verbraucht ein Kaltstart 38k Token für System-Prompt und Tool-Schemata pro Durchlauf. Bei 200 Durchläufen pro Tag sind das 7,6 Mio. Input-Token pro Tag. Zu Sonnet-Preisen (~15 $/M Output, ~3 $/M Input) sind das ~23 $/Tag oder ~700 $/Monat allein für MCP-Tool-Definitionen – bevor irgendeine tatsächliche Arbeit erledigt wird. Caching hilft nur bei identischen Präfixen; das Rotieren eines MCP-Servers macht es ungültig.
Was kaputt geht
- Tool-Auswahl verschlechtert sich: Bei 142 Tools im Kontext begann Claude, das falsche Tool für offensichtliche Anfragen auszuwählen (z. B.
linear_search_issues, wenn eine Datei gelesen werden sollte). - Langsame Aufzählung: Schema-lastige Server wie AWS benötigen 4–6 Sekunden, um Tools aufzulisten.
- Stille Fehlerausbreitung: Ein schlecht beschriebenes Tool kann das Ranking für jede verwandte Anfrage beeinträchtigen.
Die Lösung: Gateway-Muster mit BM25
Der Nutzer wechselte zu einem Gateway-Muster mit Ratel, einer quelloffenen, prozessinternen Rust-Bibliothek mit BM25-Ranking. Claude sieht jetzt nur noch drei Tools: search_tools, invoke_tool und auth. Alles andere wird bei Bedarf gerankt. Ergebnisse:
- Kaltstart von 38k auf ~4k Token gesunken.
- Falsche Tool-Auswahl fast eliminiert, da das Modell nur die Top 5 sieht, die nach Abfrage gerankt sind.
- Einrichtung dauerte 10 Minuten (ein Befehl für den Claude-Code-Import).
Der Autor merkt an, dass die meisten „MCP-Optimierer“-Startups nur BM25-Suche in neuem Gewand sind. Tool-Beschreibungen sind kurz, strukturiert und voller Keyword-Übereinstimmungen – keine Vektor-DB oder LLM-in-the-Loop nötig. BM25 über eine flache Projektion von Name + Beschreibung erzielt 90 % des Gewinns deterministisch in Mikrosekunden, offline.
Wichtige Lektion: „Ersetzen“ schlägt „Vorschlagen“. Wenn Ihr Gateway dem Modell 5 Tools statt 142 übergibt, geht die Rechnung auf. Wenn es 5 zusätzlich zu 142 vorschlägt, lädt das Modell immer noch 142, und Sie haben nichts gespart.
📖 Lesen Sie die vollständige Quelle: r/ClaudeAI
👀 Siehe auch

Claude Octopus v8.48: Multi-KI-Orchestrierungs-Plugin für Entwicklungs-Workflows
Claude Octopus v8.48 ist ein Open-Source-Plugin, das die KI-Modelle Claude, Codex und Gemini parallel mit unterschiedlichen Rollen über die Entwicklungsphasen hinweg orchestriert. Es beinhaltet eine 75%-Konsensschwelle zwischen den Phasen, frische Kontextfenster für komplexe Aufgaben und spezifische Befehle wie /octo:embrace für die vollständige Lebenszyklusentwicklung.

Storybloq: Ein Projekt-Tracker im .story/-Verzeichnis Ihres Repos hat jetzt eine Mac-App
Storybloq, ein Projekt-Tracker, der Tickets, Issues, Roadmap-Phasen und Sitzungsübergaben als JSON/Markdown in einem .story/-Verzeichnis in Ihrem Repository speichert, ist jetzt als kostenlose Mac-App im App Store erhältlich. Es integriert sich über CLI und MCP-Server mit Claude Code und wurde vollständig mit Claude Code erstellt.

Ausführen von Qwen3.6-35B-A3B-UD-Q5_K_XL lokal mit VS Code Copilot auf AMD R9700
Ein Benutzer teilt sein funktionierendes llama.cpp-Setup für Qwen3.6-35B-A3B-UD-Q5_K_XL auf einer einzelnen AMD R9700 mit Vulkan, mit dem er eine vollständige Website und Playwright-Tests von Grund auf mit minimaler Anleitung generieren konnte.

Claude-Wachstumsfähigkeit: Strukturierte B2B-SaaS-Wachstumsplaybooks für KI-Codierungsagenten
Ein Entwickler hat eine Claude-Wachstums-Fähigkeit erstellt, die 6 erprobte Playbooks basierend auf 5 SaaS-Fallstudien, Partnerschaften mit 90 Mio. USD Jahresumsatz und 1.800 Nutzerinterviews enthält. Sie strukturiert B2B-SaaS-Wachstumsarbeit von der PMF-Validierung bis zum Kanalökosystem und Vertrieb.