Claude Code System-Prompt löst 429-Fehler: OAuth-Rate-Limit-Pool

Ein Entwickler, der einen LLM-Proxy baute, entdeckte, dass die Ratenlimit-Verarbeitung von Anthropic für OAuth-Tokens vom Inhalt des System-Prompts abhängt, nicht von Headern oder Tokentyp.

Das Problem

Der Entwickler hatte eine funktionierende Einrichtung mit:

Anthropic SDK mit authToken
Beta-Headern (claude-code-20250219, oauth-2025-04-20)
user-agent: claude-cli/2.1.75
x-app: cli

Haiku funktionierte einwandfrei, aber Sonnet lieferte hartnäckige 429-Ratenlimit-Fehler ohne Retry-After-Header, ohne Ratenlimit-Header, nur "message": "Error". Währenddessen hatte ein KI-Agent (der OpenClaw ausführte) auf demselben Server mit demselben OAuth-Token keine Probleme mit Sonnet 4.6.

Die Lösung

Nach der Untersuchung des Anthropic-Provider-Quellcodes von OpenClaw (@mariozechner/pi-ai) fand der Entwickler diesen Code:

// Für OAuth-Tokens MÜSSEN wir die Claude Code-Identität einbeziehen
if (isOAuthToken) {
    params.system = [{
        type: "text",
        text: "You are Claude Code, Anthropic's official CLI for Claude.",
    }];
}

Das Hinzufügen dieser einen Zeile zum Proxy behebt die Sonnet-Ratenlimit-Fehler sofort.

Wie es funktioniert

Die API leitet Anfragen basierend darauf, ob Ihr System-Prompt sich als Claude Code identifiziert, an das Claude Code-Ratenlimit-Pool weiter (das separat und höher ist als das reguläre API-Pool). Dieses Verhalten ist weder in den SDK-Dokumenten noch in den API-Dokumenten beschrieben.

Praktische Lösung

Wenn Sie Anthropic OAuth-Tokens verwenden und mysteriöse 429-Fehler erhalten, fügen Sie "You are Claude Code, Anthropic's official CLI for Claude." zu Ihrem System-Prompt hinzu.

📖 Read the full source: r/ClaudeAI

Anthropics undokumentiertes OAuth-Rate-Limit-Pool erfordert Claude Code System-Prompt

Das Problem

Die Lösung

Wie es funktioniert

Praktische Lösung

👀 Siehe auch

OpenClaw API Budgetauslauf: Einstellungen, die sofort geändert werden müssen

KV-Cache-Quantisierungsprobleme bei lokalen Codierungs-Agents bei hohen Kontextlängen

Arbeiteragenten sollten nicht direkt Speicher schreiben: Ein Kurator-Agent-Muster

Reddit-Benutzer teilt Prompt-Struktur, um Code-Ausgabe-Drift von Claude bei komplexen Aufgaben zu reduzieren