Claude CLI v2.1.154 brise le vLLM local — un correctif d'une ligne le répare

✍️ OpenClawRadar📅 Publié: May 30, 2026🔗 Source

Claude CLI v2.1.154 a introduit la prise en charge des workflows, mais ce faisant, il a ajouté trois nouveaux rôles de message API (ctx, msg et system) qui ont cassé la compatibilité avec les serveurs vLLM locaux. Le correctif est une modification d'une ligne dans les définitions du protocole Anthropic de vLLM.

Le problème

Les versions de Claude CLI ≥2.1.154 envoient désormais des messages avec des rôles au-delà de user et assistant. Le point de terminaison API Anthropic de vLLM n'acceptait que les deux rôles d'origine, ce qui entraînait l'échec des requêtes du CLI lorsqu'elles pointaient vers une instance vLLM locale.

Le correctif d'une ligne

Le correctif met à jour le champ role dans vllm/entrypoints/anthropic/protocol.py pour autoriser les nouveaux rôles :

--- a/vllm/entrypoints/anthropic/protocol.py
+++ b/vllm/entrypoints/anthropic/protocol.py
@@ -65,7 +65,7 @@ class AnthropicContentBlock(BaseModel):
 class AnthropicMessage(BaseModel):
     """Structure du message"""
-    role: Literal["user", "assistant"]
+    role: Literal["user", "assistant", "ctx", "msg", "system"]

C'est tout. Après avoir appliqué cette modification, vous pouvez utiliser les derniers workflows de Claude CLI avec des modèles locaux basés sur vLLM comme MiniMax-M2.7 (le seul modèle testé par l'auteur).

Si vous exécutez un point de terminaison local compatible Anthropic sur vLLM, appliquez ce correctif pour continuer à travailler avec Claude CLI ≥2.1.154.

📖 Lire la source complète : r/LocalLLaMA

👀 See Also

Tips

Réduire les Hallucinations de Claude avec l'Injection d'Invites Pré-Sortie

Un post Reddit détaille une méthode pour réduire de moitié les hallucinations de Claude AI en utilisant une invite pré-réponse qui force le modèle à enregistrer les incertitudes et les prochaines étapes avant de répondre. L'approche implique d'ajouter des instructions markdown spécifiques au prompt système de Claude et de créer un script Python.

Mar 24, 2026, 01:45 PM UTC

OpenClawRadar

Tips

Demander à l'IA de définir ses propres termes à partir de principes premiers pour de meilleures sorties et un raisonnement vérifiable

Un utilisateur sur r/ClaudeAI a découvert qu'ajouter une seule instruction pour décomposer les termes indéfinis en leur sens atomique avant de procéder produit des résultats plus spécifiques et permet le débogage via une chaîne de raisonnement traçable.

May 15, 2026, 06:16 AM UTC

OpenClawRadar

Tips

Claude Code Auto-audit trouve 3 Go de déchets dans ~/.claude — Voici comment le nettoyer

Un utilisateur a demandé à Claude Code d'auditer son propre répertoire ~/.claude et a trouvé 2,6 Go de transcripts de session obsolètes, 170 Mo de journaux de tentatives de télémétrie échouées et 153 Mo de tampons d'annulation — passant de 3 Go à moins de 200 Mo après le nettoyage.

May 6, 2026, 02:20 AM UTC

OpenClawRadar

Tips

Conception Claude : 7 astuces pour ne pas brûler vos limites

Verrouillez le brief dans une conversation Claude classique d'abord, configurez le système de design avant la première requête, joignez des références sous forme de captures d'écran, liez des sous-répertoires pas des dépôts entiers, utilisez les curseurs pour les petites modifications, collez les commentaires en ligne comme sauvegarde, adaptez le format d'exportation à la destination.

May 7, 2026, 12:20 PM UTC

OpenClawRadar