Claude CLI v2.1.154 bricht lokales vLLM — Einzeiliger Patch behebt es

✍️ OpenClawRadar📅 Veröffentlicht: 30. Mai 2026🔗 Source

Claude CLI v2.1.154 hat Unterstützung für Workflows eingeführt, dabei aber drei neue API-Nachrichtenrollen (ctx, msg und system) hinzugefügt, die die Kompatibilität mit lokalen vLLM-Servern gebrochen haben. Der Fix ist eine einzeilige Änderung in vLLMs Anthropic-Protokolldefinitionen.

Das Problem

Claude CLI-Versionen ≥2.1.154 senden jetzt Nachrichten mit Rollen über user und assistant hinaus. vLLMs Anthropic-API-Endpunkt akzeptierte nur die ursprünglichen zwei Rollen, was dazu führte, dass Anfragen von der CLI bei einem lokalen vLLM-Instance fehlschlugen.

Der einzeilige Patch

Der Patch aktualisiert das role-Feld in vllm/entrypoints/anthropic/protocol.py, um die neuen Rollen zu erlauben:

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Message structure"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

Das war's. Nach Anwendung dieser Änderung können Sie die neuesten Claude CLI-Workflows mit vLLM-basierten lokalen Modellen wie MiniMax-M2.7 (das einzige vom Autor getestete Modell) verwenden.

Wenn Sie einen lokalen anthropic-kompatiblen Endpunkt auf vLLM betreiben, wenden Sie diesen Patch an, um mit Claude CLI ≥2.1.154 weiterzuarbeiten.

📖 Vollständige Quelle lesen: r/LocalLLaMA

👀 Siehe auch

Tipps

Warum Ihr Repository nicht Ihr Gedächtnis sein sollte: Trennung von System und Wissen

Die Verwendung des Repositorys als organisatorisches Gedächtnis führt zu verrauschten Suchergebnissen, veralteten Informationen und vergrabenen Entscheidungen. Die Trennung von System-Assets und Wissen (Erfahrungen, Fehleranalysen, Architekturänderungen) ist entscheidend für das Skalieren von KI-Teams.

9. Juli 2026, 12:18 UTC

OpenClawRadar

Tipps

OpenClaw Discord-Proxy-Fix für REST-API-Timeout-Probleme

Ein Benutzer berichtet, dass er Verbindungsprobleme mit OpenClaw Discord behoben hat, bei denen sich WebSocket verbindet, aber REST-API-Aufrufe mit "fetch failed UND_ERR_CONNECT_TIMEOUT"-Fehlern fehlschlagen. Die Lösung umfasst das Erstellen einer proxy-preload.cjs-Datei und das Festlegen globaler undici-Proxy-Einstellungen.

25. März 2026, 00:45 UTC

OpenClawRadar

Tipps

Warum die meisten Claude-Pipeline-Fehler auf Prompts und nicht auf Modelle zurückgehen – und wie man sie mit Skills behebt

Ein Reddit-Beitrag argumentiert, dass die Grundursache für Pipeline-Fehler in Claude-Workflows darin liegt, Prompts wie Fähigkeiten zu behandeln. Der Fix: Eingabeverträge, Ausgabeschemata und eine Lerndatei definieren – und eine Fähigkeit zu dem machen, was man auf v1 befördert.

9. Mai 2026, 12:20 UTC

OpenClawRadar

Tipps

Ein Zwei-Schritt-KI-Workflow für die Modernisierung von Legacy-Code

Ein Reddit-Beitrag skizziert einen zweistufigen 'Reverse Engineering'-Ansatz für den Einsatz von KI mit Legacy-Code: Zuerst wird die Geschäftslogik in ein technologieunabhängiges Business Requirement Document extrahiert, dann wird ein 'Master Architect'-Prompt verwendet, um von Grund auf mit modernen Best Practices neu aufzubauen.

24. Feb. 2026, 01:45 UTC

OpenClawRadar