Claude CLI v2.1.154 Quebra vLLM Local — Correção de Uma Linha Resolve

✍️ OpenClawRadar📅 Publicado: May 30, 2026🔗 Source

O Claude CLI v2.1.154 introduziu suporte a workflows, mas ao fazer isso adicionou três novos papéis de mensagens na API (ctx, msg e system) que quebraram a compatibilidade com servidores vLLM locais. A correção é uma alteração de uma linha nas definições do protocolo Anthropic do vLLM.

O Problema

Versões do Claude CLI ≥2.1.154 agora enviam mensagens com papéis além de user e assistant. O endpoint da API Anthropic do vLLM só aceitava os dois papéis originais, fazendo com que as requisições do CLI falhassem ao apontar para uma instância local do vLLM.

O Patch de Uma Linha

O patch atualiza o campo role em vllm/entrypoints/anthropic/protocol.py para permitir os novos papéis:

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Estrutura da mensagem"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

É isso. Após aplicar esta alteração, você pode usar os workflows mais recentes do Claude CLI com modelos locais baseados em vLLM, como o MiniMax-M2.7 (o único modelo testado pelo autor).

Se você executa um endpoint compatível com Anthropic no vLLM local, aplique este patch para continuar funcionando com o Claude CLI ≥2.1.154.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

Tips

Claude Code Requer Prompts Específicos, Não Instruções Vagas

Um desenvolvedor relata que o Claude Code produz melhores resultados com prompts detalhados em vez de instruções vagas, citando experiência com 4 bilhões de tokens ao longo de 5 meses.

Mar 10, 2026, 06:45 PM UTC

OpenClawRadar

Tips

UI Orientado por Anotações: Como Projetar Templates no Figma e Deixar Claude Extrair Coordenadas

Pule a construção de um mecanismo de layout personalizado: crie PNGs planos no Figma, desenhe retângulos coloridos para os slots, alimente ambos ao Claude e obtenha definições de áreas editáveis com alvos de toque. Uma tarde em vez de semanas.

May 12, 2026, 08:18 AM UTC

OpenClawRadar

Tips

A maioria das pessoas usa Claude a 5% da sua capacidade – Veja como corrigir isso

Após 60+ horas testando prompts no Claude Opus 4.7, um usuário compartilha uma receita de 5 etapas: atribuir função, carregar contexto específico, definir restrições, formatar saída e adicionar função de forçagem.

May 31, 2026, 12:15 AM UTC

OpenClawRadar

Tips

Três Gargalos Ignorados em Fluxos de Trabalho de Agentes de IA: Ingestão, Gerenciamento de Contexto e Roteamento de Modelo

Uma análise aprofundada das três camadas frequentemente ignoradas ao otimizar agentes de IA: ingestão limpa de entrada, gerenciamento da janela de contexto entre etapas e roteamento de modelos apropriado para cada tarefa. Correções práticas incluem o uso de análise estruturada, resumos de saídas de etapas, esquemas tipados e correspondência de modelos com a complexidade da tarefa.

May 12, 2026, 10:18 AM UTC

OpenClawRadar