Claude CLI 2.1.154: патч для vLLM при локальном использовании

Claude CLI v2.1.154 добавил поддержку рабочих процессов, но вместе с этим ввёл три новые роли сообщений API (ctx, msg и system), которые нарушили совместимость с локальными серверами vLLM. Исправление заключается в изменении одной строки в определениях протокола Anthropic в vLLM.

Проблема

Claude CLI версий ≥2.1.154 теперь отправляет сообщения с ролями, отличными от user и assistant. Конечная точка API Anthropic от vLLM принимала только исходные две роли, из-за чего запросы от CLI к локальному экземпляру vLLM завершались ошибкой.

Патч из одной строки

Патч обновляет поле role в файле vllm/entrypoints/anthropic/protocol.py, чтобы разрешить новые роли:

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Message structure"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

Вот и всё. После применения этого изменения вы сможете использовать новейшие рабочие процессы Claude CLI с локальными моделями на основе vLLM, такими как MiniMax-M2.7 (единственная модель, протестированная автором).

Если вы запускаете локальную конечную точку, совместимую с Anthropic, на vLLM, примените этот патч, чтобы продолжить работу с Claude CLI ≥2.1.154.

📖 Читать полный источник: r/LocalLLaMA

Claude CLI v2.1.154 ломает локальный vLLM — исправление в одну строку

Проблема

Патч из одной строки

👀 Смотрите также

Память рабочего процесса против инструментов: почему загрузка контекста эффективнее гигантских промптов

Как я взаимодействую с ИИ-моделями в 2026 году по сравнению с прошлым годом: 3 ключевых изменения

Claude Code лучше работает в качестве рецензента кода, чем генератора.

ИИ-агенты раскрыли мои небрежные промпты: чёткость побеждает более умные модели