Routing von Claude API-Traffic zur Kostenkontrolle nach Änderung des Max-Abonnements

✍️ OpenClawRadar📅 Veröffentlicht: 13. April 2026🔗 Source
Routing von Claude API-Traffic zur Kostenkontrolle nach Änderung des Max-Abonnements
Ad

API-Abrechnungsmigration und Kostenauswirkungen

Seit Mittag PT deckt Anthropics Max-Abonnement keine Nutzung von Drittanbietertools wie OpenClaw mehr ab. Alle OpenClaw-Benutzer sind jetzt auf API-Abrechnung mit diesen Tarifen umgestellt:

  • Claude Opus 4.6: 5 $ pro Million Eingabe-Tokens, 25 $ pro Million Ausgabe-Tokens
  • Claude Sonnet 4.6: 3 $ pro Million Eingabe-Tokens, 15 $ pro Million Ausgabe-Tokens
  • Claude Haiku 4.5: 1 $ pro Million Eingabe-Tokens, 5 $ pro Million Ausgabe-Tokens

Eine intensive OpenClaw-Sitzung auf Opus kann 1-4 $ kosten, während dieselbe Sitzung auf Sonnet 0,20-0,80 $ kostet, mit ähnlichen Ergebnissen für die meisten Aufgaben.

Ad

Die Routing-Lösung

Die meisten OpenClaw-Operationen benötigen kein Opus: Herzschlagprüfungen, Dateilesevorgänge, Zusammenfassungen, Routing-Entscheidungen und kurze Tool-Aufrufe können alle von Sonnet bearbeitet werden. Ohne eine Routing-Schicht trifft jede Anfrage Ihr Standardmodell, was möglicherweise Opus-Budget für einfache Aufgaben verschwendet.

Ein lokaler Proxy leitet Claude-Anfragen nach Komplexität: Einfache Aufgaben gehen automatisch an Sonnet, komplexe werden an Opus eskaliert. Dieser Ansatz hat die Kosten erheblich gesenkt, ohne die Qualität bei wichtigen Aufgaben zu beeinträchtigen.

Der Proxy ist Open Source und über npm installierbar: npm install -g @relayplane/proxy

Detaillierte Dokumentation und Diskussion sind auf r/ClaudeCode verfügbar, wo die Lösung 52.000 Aufrufe erhalten hat.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Rudel: Open-Source-Analyse für Claude Code-Sitzungen
Werkzeuge

Rudel: Open-Source-Analyse für Claude Code-Sitzungen

Rudel ist ein Open-Source-Analysewerkzeug, das Claude-Code-Sitzungen analysiert und Einblicke aus 1.573 echten Sitzungen mit über 15 Millionen Tokens und 270.000+ Interaktionen bietet. Es deckt Muster auf wie 4 % Skills-Nutzung, 26 % Abbruchraten und Fehlerkaskadenmuster.

OpenClawRadar
CodeLedger und Vibecop Updates für Multi-Agent AI-Codierungskosten- und Qualitätsverfolgung
Werkzeuge

CodeLedger und Vibecop Updates für Multi-Agent AI-Codierungskosten- und Qualitätsverfolgung

CodeLedger verfolgt jetzt Ausgaben über Claude Code, Codex CLI, Cline und Gemini CLI, indem es lokale Sitzungsdateien ausliest, während Vibecop automatisierte Qualitätsprüfungen mit neuen LLM-spezifischen Detektoren und einem Ein-Befehl-Setup für mehrere KI-Codierungstools hinzufügt.

OpenClawRadar
OpenClaw implementiert Agent History Compression, um die Kontextnutzung zu reduzieren
Werkzeuge

OpenClaw implementiert Agent History Compression, um die Kontextnutzung zu reduzieren

OpenClaw komprimiert nun den Agentenverlauf, indem abgeschlossene Teilaufgabenprotokolle durch strukturierte Zusammenfassungen ersetzt werden, wodurch ~1 Million Token auf ~30.000 reduziert werden. Das System nutzt einen 4-Pass-Scanner, um Aufgabenlebenszyklen zu identifizieren, und erstellt maskierte Zusammenfassungen, die die Agentenkompatibilität beibehalten.

OpenClawRadar
AIMEAT: Ein selbstgehostetes Protokoll für KI-Agenten, lokale LLMs und gemeinsame Fähigkeiten
Werkzeuge

AIMEAT: Ein selbstgehostetes Protokoll für KI-Agenten, lokale LLMs und gemeinsame Fähigkeiten

AIMEAT ist ein selbst gehostetes Protokoll und Server, das Menschen, KI-Agenten und lokalen LLMs ermöglicht, Apps, Wissen und Fähigkeiten über HTTP/JSON zu teilen. Keine Anbieterbindung, kein spezielles SDK – einfache Prompts und URL-Aufrufe.

OpenClawRadar