OpenClaw: GPT-5.x und Kimi K2.5 ersetzen Claude nach Anthropic-Verbot

Community-Rangliste und Modellpräferenzen

Laut Community-Abstimmungen, die unter pricepertoken.com/leaderboards/openclaw ab dem 5. April verfolgt wurden (Netto = Upvotes minus Downvotes):

Kimi K2.5 -- +49 Netto (54 Up, 5 Down). $0,38/M Input-Tokens. Native OpenClaw-Unterstützung hinzugefügt. 13x günstiger als Opus.
GLM 4.7 -- +20 Netto (25 Up, 5 Down). $0,39/M Input. Budget-Cloud-Wahl.
Gemini 3 Flash Preview -- +18 Netto (21 Up, 3 Down). Nicht Pro — die Flash-Variante. Leute wählen Geschwindigkeit + Kosten über rohe Qualität.
Claude Opus 4.5 -- +18 Netto, aber 32 Up / 14 Down. Die meisten Stimmen insgesamt, aber auch das umstrittenste Modell. Die Meinungen gehen auseinander, ob man API-Preise für etwas zahlen soll, das früher inklusive war.
Claude Opus 4.6 -- +17 Netto (19 Up, 2 Down).

Am häufigsten übernommener Ersatz: GPT-5.x

OpenAI hat offiziell GPT-5.4-Unterstützung für OpenClaw hinzugefügt und bietet 1M kostenlose Tokens/Tag auf der Data-Sharing-Stufe an. Codex-Abonnements erlauben ausdrücklich die Nutzung von Drittanbietertools.

Matthew Bermans vollständiger Stack ist nun: GPT 5.3 Codex XH für Coding, GPT 5.2 als Standard, GPT 5 Mini für Klassifikatoren. Claude nur als Backup.

Lokale Modelloptionen

Der Konsens in r/LocalLLaMA umfasst:

Qwen 3.5 27B -- Top-Wahl. 72,4% SWE-bench (entspricht GPT-5 mini). Zen van Riel betreibt die 35B-Version mit 100-140 Tok/s auf einer RTX 5090.
Qwen3-Coder:32B -- "extrem stabile Tool-Aufrufe"
Llama 4 -- Standard für breit angelegte lokale Bereitstellungen
Devstral-24B -- empfohlen als primäres Modell mit GLM-4.7 flash als Fallback

Ollama wurde im März ein offizieller OpenClaw-Anbieter. Eine Person auf X betreibt Qwen 3.5 + OpenClaw + Ollama komplett kostenlos.

Hybride Setups und Kostenüberlegungen

Die Leute, die am zufriedensten zu sein scheinen, setzen nicht vollständig auf ein Modell. Sie betreiben gestaffelte Stacks:

Teures Modell (Claude/GPT) für komplexe Schlussfolgerungen
Günstiges Modell (DeepSeek bei $0,14/M, Kimi, GLM) für Routineaufgaben

Ein Nutzer baute ein Kubernetes-Gateway über 5 Raspberry Pis, das Claude, GPT, Gemini und DeepSeek hinter einer einzigen API routet.

@0xzak teilte eine spezifische Konfiguration: DeepSeek für Routine ($0,14/$1,10) vs. Sonnet für Komplexes ($3/$15), contextTokens bei 120k nicht 150k.

Workarounds und Migrationswerkzeuge

OpenClaw umging das OAuth-Verbot, indem es über die lokale Claude-CLI-Binärdatei geleitet wurde, anstatt OAuth-Tokens zu verwenden. Pete selbst empfahl diese Methode.

Oh-My-Codex (OmX) — eine Workflow-/Orchestrierungsschicht für OpenAIs Codex CLI gewann 13K Sterne in derselben Woche wie das Verbot.

Auswirkungen und Kostenänderungen

Berichten zufolge liefen 60 % der aktiven OpenClaw-Sitzungen vor dem Verbot auf Abonnementguthaben.

Der Kostenanstieg ist brutal. Starke Nutzer gingen von ~$200/Monat pauschal auf ~$675/Monat zu API-Preisen über. Einige automatisierte Sitzungen erreichen $1.000-$5.000/Tag.

Anthropic bietet ein einmaliges Guthaben + 30 % auf vorausbezahlte Pakete an, aber die Stimmung überall ist, dass es zu wenig ist.

📖 Read the full source: r/openclaw

OpenClaw-Benutzer melden Modellersatz nach Anthropic-Verbot

Community-Rangliste und Modellpräferenzen

Am häufigsten übernommener Ersatz: GPT-5.x

Lokale Modelloptionen

Hybride Setups und Kostenüberlegungen

Workarounds und Migrationswerkzeuge

Auswirkungen und Kostenänderungen

👀 Siehe auch

Anthropic bringt 10 Finanz-KI-Agenten für Pitchbooks, KYC und Monatsabschluss auf den Markt

OpenClaw-Agent-Ausgabenmuster und fehlende Ausgabenobergrenzen

Claude Code-Nutzer stoßen schneller als erwartet an Nutzungsgrenzen, Fehler werden vermutet

GLM-5.1 veröffentlicht mit Programmierleistung auf dem Niveau von Claude Opus 4.5