OpenClaw-Benutzer melden Modellersatz nach Anthropic-Verbot

Community-Rangliste und Modellpräferenzen
Laut Community-Abstimmungen, die unter pricepertoken.com/leaderboards/openclaw ab dem 5. April verfolgt wurden (Netto = Upvotes minus Downvotes):
- Kimi K2.5 -- +49 Netto (54 Up, 5 Down). $0,38/M Input-Tokens. Native OpenClaw-Unterstützung hinzugefügt. 13x günstiger als Opus.
- GLM 4.7 -- +20 Netto (25 Up, 5 Down). $0,39/M Input. Budget-Cloud-Wahl.
- Gemini 3 Flash Preview -- +18 Netto (21 Up, 3 Down). Nicht Pro — die Flash-Variante. Leute wählen Geschwindigkeit + Kosten über rohe Qualität.
- Claude Opus 4.5 -- +18 Netto, aber 32 Up / 14 Down. Die meisten Stimmen insgesamt, aber auch das umstrittenste Modell. Die Meinungen gehen auseinander, ob man API-Preise für etwas zahlen soll, das früher inklusive war.
- Claude Opus 4.6 -- +17 Netto (19 Up, 2 Down).
Am häufigsten übernommener Ersatz: GPT-5.x
OpenAI hat offiziell GPT-5.4-Unterstützung für OpenClaw hinzugefügt und bietet 1M kostenlose Tokens/Tag auf der Data-Sharing-Stufe an. Codex-Abonnements erlauben ausdrücklich die Nutzung von Drittanbietertools.
Matthew Bermans vollständiger Stack ist nun: GPT 5.3 Codex XH für Coding, GPT 5.2 als Standard, GPT 5 Mini für Klassifikatoren. Claude nur als Backup.
Lokale Modelloptionen
Der Konsens in r/LocalLLaMA umfasst:
- Qwen 3.5 27B -- Top-Wahl. 72,4% SWE-bench (entspricht GPT-5 mini). Zen van Riel betreibt die 35B-Version mit 100-140 Tok/s auf einer RTX 5090.
- Qwen3-Coder:32B -- "extrem stabile Tool-Aufrufe"
- Llama 4 -- Standard für breit angelegte lokale Bereitstellungen
- Devstral-24B -- empfohlen als primäres Modell mit GLM-4.7 flash als Fallback
Ollama wurde im März ein offizieller OpenClaw-Anbieter. Eine Person auf X betreibt Qwen 3.5 + OpenClaw + Ollama komplett kostenlos.
Hybride Setups und Kostenüberlegungen
Die Leute, die am zufriedensten zu sein scheinen, setzen nicht vollständig auf ein Modell. Sie betreiben gestaffelte Stacks:
- Teures Modell (Claude/GPT) für komplexe Schlussfolgerungen
- Günstiges Modell (DeepSeek bei $0,14/M, Kimi, GLM) für Routineaufgaben
Ein Nutzer baute ein Kubernetes-Gateway über 5 Raspberry Pis, das Claude, GPT, Gemini und DeepSeek hinter einer einzigen API routet.
@0xzak teilte eine spezifische Konfiguration: DeepSeek für Routine ($0,14/$1,10) vs. Sonnet für Komplexes ($3/$15), contextTokens bei 120k nicht 150k.
Workarounds und Migrationswerkzeuge
OpenClaw umging das OAuth-Verbot, indem es über die lokale Claude-CLI-Binärdatei geleitet wurde, anstatt OAuth-Tokens zu verwenden. Pete selbst empfahl diese Methode.
Oh-My-Codex (OmX) — eine Workflow-/Orchestrierungsschicht für OpenAIs Codex CLI gewann 13K Sterne in derselben Woche wie das Verbot.
Auswirkungen und Kostenänderungen
Berichten zufolge liefen 60 % der aktiven OpenClaw-Sitzungen vor dem Verbot auf Abonnementguthaben.
Der Kostenanstieg ist brutal. Starke Nutzer gingen von ~$200/Monat pauschal auf ~$675/Monat zu API-Preisen über. Einige automatisierte Sitzungen erreichen $1.000-$5.000/Tag.
Anthropic bietet ein einmaliges Guthaben + 30 % auf vorausbezahlte Pakete an, aber die Stimmung überall ist, dass es zu wenig ist.
📖 Read the full source: r/openclaw
👀 Siehe auch

Bird Skill Repository Entfernt — Sichern Sie jetzt Ihren X/Twitter-Zugang
Die beliebte Bird-Skill von @steipete wurde von GitHub entfernt. Benutzer sollten ihre Installationen sofort sichern.

Claude-Dienstvorfall: Erhöhte Fehlerraten auf allen Plattformen
Claude verzeichnete am 2. März 2026 erhöhte Fehlerraten auf den Plattformen claude.ai, der Konsole und Claude Code, wobei Probleme bei Login-/Logout-Pfaden und einigen API-Methoden auftraten. Der Vorfall wurde nach etwa 4 Stunden behoben.

Wenn RLVR kleinen feinabgestimmten Modellen hilft: Eine Analyse mit 12 Datensätzen
Ein kontrolliertes Experiment testete das Hinzufügen von RLVR-Verstärkungslernen auf 1,7-Milliarden-Parameter-Modelle, die mit SFT feinabgestimmt wurden. Die Ergebnisse zeigen, dass Textgenerierungsaufgaben im Durchschnitt um +2,0 Prozentpunkte verbessert wurden, während strukturierte Aufgaben um -0,7 Prozentpunkte zurückgingen.

Claude Shannons Schacharbeit von 1950 sagte das Kernproblem von GenAI voraus: Raten vs. Wissen
Shannons Schachaufsatz von 1950 formulierte die zentrale Herausforderung der KI: unter Unsicherheit „einigermaßen gute“ Entscheidungen zu treffen – genau das Problem, mit dem generative KI heute konfrontiert ist, wenn sie polierte, aber falsche Antworten liefert.