Qwen 3.5 Chat Template Release mit 21 Fehlerbehebungen für Agenten-Workflows

Ein Entwickler hat eine gepatchte Chat-Vorlage für Qwen-3.5-Modelle veröffentlicht, die 21 Fehler behebt, die bei agentenbasierten Arbeitsabläufen auftraten. Dies ist ein direkter Ersatz für die offizielle Vorlage, der lediglich den Austausch der Datei chat_template.jinja erfordert.
Wichtige Korrekturen
Der Entwickler hat speziell Qwen 3.5 35B für agentenbasierte Arbeitsabläufe eingesetzt und die folgenden Hauptprobleme behoben:
- Absturz bei Tool-Aufrufen: Behebung eines Absturzes im Zusammenhang mit
arguments | items(referenziert als HF-Diskussion #4). - Leck von Tool/Think-Blöcken: Der Inhalt von
<tool_call>gelangt nicht mehr in<think>-Blöcke, wobei das Denken automatisch deaktiviert wird, wenn Tools aktiv sind. - Parallele Tool-Aufrufe: Aufrufe werden nun korrekt mit
\n\n-Trennzeichen getrennt. - Tiefe Agenten-Schleifen: Verhindert Abstürze nach 5 oder mehr Tool-Sprüngen.
- Behandlung unbekannter Rollen: Rollen wie 'planner' und 'critic' fallen nun elegant zurück, anstatt einen Absturz zu verursachen.
- Streaming-Parser: Bietet saubere XML-Grenzen für das Streaming.
- Konfigurierbare Kürzung: Ermöglicht die Festlegung einer maximalen Zeichenbegrenzung für große Tool-Argumente und Antworten.
- Unterstützung für Entwickler-Rollen: Fügt Unterstützung für Rollen wie 'Claude Code', 'Codex' und 'OpenCode' hinzu.
Eine vollständige Liste aller 21 Korrekturen ist im README des Projekts verfügbar.
Konfiguration
Die Vorlage enthält konfigurierbare Variablen. Sie können über Befehlszeilenargumente gesetzt werden:
--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'
Kompatibilität & Testen
Die Vorlage wurde auf den folgenden Plattformen mit den angegebenen Mindestversionen getestet:
- llama.cpp (b4242+)
- Open WebUI (v0.4.8+)
- vLLM (v0.6.4+)
- Ollama (v0.5.0+)
- LM Studio (v0.3.5+)
- Text Generation WebUI
Sie ist mit allen Qwen-3.5-Modellen (35B, 27B, 14B, 9B, 4B und der Coder-Serie) kompatibel und abwärtskompatibel mit Qwen3 32B.
Source und Lizenz
Die Vorlage steht auf HuggingFace zum Download bereit unter barubary/qwen3.5-barubary-attuned-chat-template. Sie wird unter der Apache-2.0-Lizenz veröffentlicht, und der Entwickler freut sich über Feedback und Fehlerberichte.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung
Eine neue Fähigkeit für OpenClaw-Agenten adressiert das häufige Problem, bei dem Agenten den nächsten Schritt identifizieren, aber bei 'Hier ist, was als Nächstes zu tun ist' stoppen und eine menschliche Übergabe erfordern. Die Fähigkeit ermöglicht es Agenten, bestimmte Aktionen selbst auszuführen, wie Registrieren, Posten, Antworten und Unterschreiben.

Statespace: Erstellen Sie interaktive Web-Apps für OpenClaw-Agenten mit Markdown
Statespace ist ein kostenloses, quelloffenes Framework zum Erstellen und Teilen von KI-freundlichen Web-Apps, die OpenClaw-Agenten mit reinem Markdown navigieren und bedienen können. Es ermöglicht Ihnen, Werkzeuge, Komponenten und Anweisungen in Markdown-Dateien zu definieren, auf die Agenten über HTTP zugreifen.

Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines
Claw Compactor ist eine Open-Source-LLM-Token-Komprimierungs-Engine, die eine 14-stufige Fusion-Pipeline verwendet, um eine durchschnittliche Kompression von 54 % ohne LLM-Inferenzkosten zu erreichen. Sie umfasst spezialisierte Kompressoren für Code, JSON, Protokolle, Diffs und Suchergebnisse mit reversiblen Komprimierungsfähigkeiten.

Workflow-Orchestrator mit KI-CLI-Integration für Sysadmin-Aufgaben
Ein Entwickler hat einen dateibasierten Workflow-Orchestrator namens 'workflow' erstellt, der sich mit Claude Code, Codex CLI und Gemini CLI integriert. Er generiert, aktualisiert, korrigiert und verfeinert YAML-Workflows aus natürlichen Sprachbeschreibungen für Sysadmin-Aufgaben.