Qwen 3.5 Chat Template: 21 Bug Fixes für Agenten-Workflows

Ein Entwickler hat eine gepatchte Chat-Vorlage für Qwen-3.5-Modelle veröffentlicht, die 21 Fehler behebt, die bei agentenbasierten Arbeitsabläufen auftraten. Dies ist ein direkter Ersatz für die offizielle Vorlage, der lediglich den Austausch der Datei chat_template.jinja erfordert.

Wichtige Korrekturen

Der Entwickler hat speziell Qwen 3.5 35B für agentenbasierte Arbeitsabläufe eingesetzt und die folgenden Hauptprobleme behoben:

Absturz bei Tool-Aufrufen: Behebung eines Absturzes im Zusammenhang mit arguments | items (referenziert als HF-Diskussion #4).
Leck von Tool/Think-Blöcken: Der Inhalt von <tool_call> gelangt nicht mehr in <think>-Blöcke, wobei das Denken automatisch deaktiviert wird, wenn Tools aktiv sind.
Parallele Tool-Aufrufe: Aufrufe werden nun korrekt mit \n\n-Trennzeichen getrennt.
Tiefe Agenten-Schleifen: Verhindert Abstürze nach 5 oder mehr Tool-Sprüngen.
Behandlung unbekannter Rollen: Rollen wie 'planner' und 'critic' fallen nun elegant zurück, anstatt einen Absturz zu verursachen.
Streaming-Parser: Bietet saubere XML-Grenzen für das Streaming.
Konfigurierbare Kürzung: Ermöglicht die Festlegung einer maximalen Zeichenbegrenzung für große Tool-Argumente und Antworten.
Unterstützung für Entwickler-Rollen: Fügt Unterstützung für Rollen wie 'Claude Code', 'Codex' und 'OpenCode' hinzu.

Eine vollständige Liste aller 21 Korrekturen ist im README des Projekts verfügbar.

Konfiguration

Die Vorlage enthält konfigurierbare Variablen. Sie können über Befehlszeilenargumente gesetzt werden:

--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'

Kompatibilität & Testen

Die Vorlage wurde auf den folgenden Plattformen mit den angegebenen Mindestversionen getestet:

llama.cpp (b4242+)
Open WebUI (v0.4.8+)
vLLM (v0.6.4+)
Ollama (v0.5.0+)
LM Studio (v0.3.5+)
Text Generation WebUI

Sie ist mit allen Qwen-3.5-Modellen (35B, 27B, 14B, 9B, 4B und der Coder-Serie) kompatibel und abwärtskompatibel mit Qwen3 32B.

Source und Lizenz

Die Vorlage steht auf HuggingFace zum Download bereit unter barubary/qwen3.5-barubary-attuned-chat-template. Sie wird unter der Apache-2.0-Lizenz veröffentlicht, und der Entwickler freut sich über Feedback und Fehlerberichte.

📖 Read the full source: r/LocalLLaMA

Qwen 3.5 Chat Template Release mit 21 Fehlerbehebungen für Agenten-Workflows

Wichtige Korrekturen

Konfiguration

Kompatibilität & Testen

Source und Lizenz

👀 Siehe auch

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung

Statespace: Erstellen Sie interaktive Web-Apps für OpenClaw-Agenten mit Markdown

Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines

Workflow-Orchestrator mit KI-CLI-Integration für Sysadmin-Aufgaben