Claude CLI v2.1.154 ломает локальный vLLM — исправление в одну строку

✍️ OpenClawRadar📅 Опубликовано: 30 мая 2026 г.🔗 Source
Claude CLI v2.1.154 ломает локальный vLLM — исправление в одну строку
Ad

Claude CLI v2.1.154 добавил поддержку рабочих процессов, но вместе с этим ввёл три новые роли сообщений API (ctx, msg и system), которые нарушили совместимость с локальными серверами vLLM. Исправление заключается в изменении одной строки в определениях протокола Anthropic в vLLM.

Проблема

Claude CLI версий ≥2.1.154 теперь отправляет сообщения с ролями, отличными от user и assistant. Конечная точка API Anthropic от vLLM принимала только исходные две роли, из-за чего запросы от CLI к локальному экземпляру vLLM завершались ошибкой.

Ad

Патч из одной строки

Патч обновляет поле role в файле vllm/entrypoints/anthropic/protocol.py, чтобы разрешить новые роли:

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Message structure"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

Вот и всё. После применения этого изменения вы сможете использовать новейшие рабочие процессы Claude CLI с локальными моделями на основе vLLM, такими как MiniMax-M2.7 (единственная модель, протестированная автором).

Если вы запускаете локальную конечную точку, совместимую с Anthropic, на vLLM, примените этот патч, чтобы продолжить работу с Claude CLI ≥2.1.154.

📖 Читать полный источник: r/LocalLLaMA

Ad

👀 Смотрите также

Запуск OpenClaw внутри Docker-контейнера Ollama для упрощения работы с сетью
Советы

Запуск OpenClaw внутри Docker-контейнера Ollama для упрощения работы с сетью

Пользователь Reddit показывает, как установить OpenClaw внутрь официального Docker-контейнера ollama/ollama, чтобы OpenClaw связывался с Ollama через localhost, избегая host.docker.internal и дополнительной настройки сети. Компромисс — более высокое использование ОЗУ.

OpenClawRadar
Попросите ИИ определить свои термины на основе первых принципов для улучшения результатов и проверяемости рассуждений
Советы

Попросите ИИ определить свои термины на основе первых принципов для улучшения результатов и проверяемости рассуждений

Пользователь на r/ClaudeAI обнаружил, что добавление одной инструкции — разбивать неопределенные термины на атомарные значения перед продолжением — дает более конкретные результаты и позволяет отлаживать цепочку рассуждений.

OpenClawRadar
Высокая загрузка ЦП/ОЗУ и перезагрузки шлюза в OpenClaw? Отключите IPv6 для Telegram
Советы

Высокая загрузка ЦП/ОЗУ и перезагрузки шлюза в OpenClaw? Отключите IPv6 для Telegram

Установка autoSelectFamily: false и dnsResultOrder: 'ipv4first' в конфиге бота Telegram предотвращает ошибки ENETUNREACH, устраняя высокую загрузку ЦП, заморозки цикла событий и перезапуски шлюза.

OpenClawRadar
Перестаньте использовать Claude как дорогой автозаполнитель — создайте SDR-систему с определениями ролей, файлами памяти и ритуалами доработки
Советы

Перестаньте использовать Claude как дорогой автозаполнитель — создайте SDR-систему с определениями ролей, файлами памяти и ритуалами доработки

Пост на Reddit утверждает, что большинство отделов продаж используют Claude как «чат-бота», а не как систему. Решение: определить роль, вести файл памяти с ICP/тоном/наработками и проводить еженедельный ритуал доработки, чтобы повышать качество результатов.

OpenClawRadar