Routing von Claude API-Traffic zur Kostenkontrolle nach Änderung des Max-Abonnements

API-Abrechnungsmigration und Kostenauswirkungen
Seit Mittag PT deckt Anthropics Max-Abonnement keine Nutzung von Drittanbietertools wie OpenClaw mehr ab. Alle OpenClaw-Benutzer sind jetzt auf API-Abrechnung mit diesen Tarifen umgestellt:
- Claude Opus 4.6: 5 $ pro Million Eingabe-Tokens, 25 $ pro Million Ausgabe-Tokens
- Claude Sonnet 4.6: 3 $ pro Million Eingabe-Tokens, 15 $ pro Million Ausgabe-Tokens
- Claude Haiku 4.5: 1 $ pro Million Eingabe-Tokens, 5 $ pro Million Ausgabe-Tokens
Eine intensive OpenClaw-Sitzung auf Opus kann 1-4 $ kosten, während dieselbe Sitzung auf Sonnet 0,20-0,80 $ kostet, mit ähnlichen Ergebnissen für die meisten Aufgaben.
Die Routing-Lösung
Die meisten OpenClaw-Operationen benötigen kein Opus: Herzschlagprüfungen, Dateilesevorgänge, Zusammenfassungen, Routing-Entscheidungen und kurze Tool-Aufrufe können alle von Sonnet bearbeitet werden. Ohne eine Routing-Schicht trifft jede Anfrage Ihr Standardmodell, was möglicherweise Opus-Budget für einfache Aufgaben verschwendet.
Ein lokaler Proxy leitet Claude-Anfragen nach Komplexität: Einfache Aufgaben gehen automatisch an Sonnet, komplexe werden an Opus eskaliert. Dieser Ansatz hat die Kosten erheblich gesenkt, ohne die Qualität bei wichtigen Aufgaben zu beeinträchtigen.
Der Proxy ist Open Source und über npm installierbar: npm install -g @relayplane/proxy
Detaillierte Dokumentation und Diskussion sind auf r/ClaudeCode verfügbar, wo die Lösung 52.000 Aufrufe erhalten hat.
📖 Read the full source: r/openclaw
👀 Siehe auch

Rudel: Open-Source-Analyse für Claude Code-Sitzungen
Rudel ist ein Open-Source-Analysewerkzeug, das Claude-Code-Sitzungen analysiert und Einblicke aus 1.573 echten Sitzungen mit über 15 Millionen Tokens und 270.000+ Interaktionen bietet. Es deckt Muster auf wie 4 % Skills-Nutzung, 26 % Abbruchraten und Fehlerkaskadenmuster.

CodeLedger und Vibecop Updates für Multi-Agent AI-Codierungskosten- und Qualitätsverfolgung
CodeLedger verfolgt jetzt Ausgaben über Claude Code, Codex CLI, Cline und Gemini CLI, indem es lokale Sitzungsdateien ausliest, während Vibecop automatisierte Qualitätsprüfungen mit neuen LLM-spezifischen Detektoren und einem Ein-Befehl-Setup für mehrere KI-Codierungstools hinzufügt.

OpenClaw implementiert Agent History Compression, um die Kontextnutzung zu reduzieren
OpenClaw komprimiert nun den Agentenverlauf, indem abgeschlossene Teilaufgabenprotokolle durch strukturierte Zusammenfassungen ersetzt werden, wodurch ~1 Million Token auf ~30.000 reduziert werden. Das System nutzt einen 4-Pass-Scanner, um Aufgabenlebenszyklen zu identifizieren, und erstellt maskierte Zusammenfassungen, die die Agentenkompatibilität beibehalten.

AIMEAT: Ein selbstgehostetes Protokoll für KI-Agenten, lokale LLMs und gemeinsame Fähigkeiten
AIMEAT ist ein selbst gehostetes Protokoll und Server, das Menschen, KI-Agenten und lokalen LLMs ermöglicht, Apps, Wissen und Fähigkeiten über HTTP/JSON zu teilen. Keine Anbieterbindung, kein spezielles SDK – einfache Prompts und URL-Aufrufe.