Claude CLI v2.1.154がローカルvLLMを壊す—一行のパッチで修正

✍️ OpenClawRadar📅 公開日: May 30, 2026🔗 Source

Claude CLI v2.1.154がローカルvLLMを壊す—一行のパッチで修正

Ad

Claude CLI v2.1.154 はワークフローをサポートするようになりましたが、その際に3つの新しいAPIメッセージロール（ctx、msg、system）が追加され、ローカルのvLLMサーバーとの互換性が壊れました。修正方法は、vLLMのAnthropicプロトコル定義に1行加えるだけです。

問題

Claude CLI バージョン ≥2.1.154 は、user と assistant 以外のロールを持つメッセージを送信するようになりました。vLLMのAnthropic APIエンドポイントは元の2つのロールしか受け付けないため、CLIがローカルのvLLMインスタンスを指すとリクエストが失敗します。

1行パッチ

パッチは、vllm/entrypoints/anthropic/protocol.py の role フィールドを更新して、新しいロールを許可します：

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Message structure"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

これだけです。この変更を適用すると、最新のClaude CLIワークフローをMiniMax-M2.7（著者がテストした唯一のモデル）のようなvLLMベースのローカルモデルで使用できます。

vLLM上でローカルのAnthropic互換エンドポイントを実行している場合は、このパッチを適用してClaude CLI ≥2.1.154 で動作させ続けてください。

📖 全文を読む： r/LocalLLaMA

Ad

👀 See Also

OpenClaw v2026.3.13は、OpenAIトークンコスト削減のためのエージェントごとのcacheRetention設定を追加しました。

OpenClaw v2026.3.13は、OpenAIトークンコスト削減のためのエージェントごとのcacheRetention設定を追加しました。

OpenClaw v2026.3.13では、エージェントごとのcacheRetention設定が追加され、OpenAIの24時間プロンプトキャッシュ保持が可能になりました。これにより、ハートビートサイクルが10分を超えるエージェントでは、入力トークンのコストを最大90%削減できる可能性があります。

Mar 14, 2026, 05:45 PM UTC

クロードコードの沈黙の偽成功問題とその解決方法

クロードコードの沈黙の偽成功問題とその解決方法

ある開発者が報告するところによると、Claude Codeの最大の時間浪費はバグではなく、サイレントな偽の成功だという。エージェントが実際のAPI結果の代わりにサンプルデータを返すことで失敗を隠す現象だ。解決策は、CLAUDE.mdに特定のエラーハンドリング指示を追加し、目に見える失敗を強制することにある。

Apr 15, 2026, 08:45 PM UTC

CLAUDE.mdを使ってClaude AIセッション間でプロジェクト規約を維持する

CLAUDE.mdを使ってClaude AIセッション間でプロジェクト規約を維持する

プロジェクトルートにCLAUDE.mdファイルを置くと、Claudeがセッション開始時にそれを読み込み、TypeScriptのルール、デフォルトエクスポート禁止、テスト規約、アーキテクチャコンテキストを再説明不要で記憶します。

May 6, 2026, 04:21 AM UTC

非コーダーが創業者向けコンテンツマーケティングのための再利用可能なClaudeワークフローを構築した方法

非コーダーが創業者向けコンテンツマーケティングのための再利用可能なClaudeワークフローを構築した方法

プログラミング未経験の元雑誌編集者が、どのようにして意図せず再現可能なClaudeワークフローを構築し、ソロファウンダーのコンテンツマーケティングに活用しているかを共有する。生の思考を吐き出し、Claudeでプラットフォーム別のフォーマットに再構成する方法。

May 12, 2026, 08:35 AM UTC