Qwen 3.5 Chat Template Release mit 21 Fehlerbehebungen für Agenten-Workflows

✍️ OpenClawRadar📅 Veröffentlicht: 17. März 2026🔗 Source
Qwen 3.5 Chat Template Release mit 21 Fehlerbehebungen für Agenten-Workflows
Ad

Ein Entwickler hat eine gepatchte Chat-Vorlage für Qwen-3.5-Modelle veröffentlicht, die 21 Fehler behebt, die bei agentenbasierten Arbeitsabläufen auftraten. Dies ist ein direkter Ersatz für die offizielle Vorlage, der lediglich den Austausch der Datei chat_template.jinja erfordert.

Wichtige Korrekturen

Der Entwickler hat speziell Qwen 3.5 35B für agentenbasierte Arbeitsabläufe eingesetzt und die folgenden Hauptprobleme behoben:

  • Absturz bei Tool-Aufrufen: Behebung eines Absturzes im Zusammenhang mit arguments | items (referenziert als HF-Diskussion #4).
  • Leck von Tool/Think-Blöcken: Der Inhalt von <tool_call> gelangt nicht mehr in <think>-Blöcke, wobei das Denken automatisch deaktiviert wird, wenn Tools aktiv sind.
  • Parallele Tool-Aufrufe: Aufrufe werden nun korrekt mit \n\n-Trennzeichen getrennt.
  • Tiefe Agenten-Schleifen: Verhindert Abstürze nach 5 oder mehr Tool-Sprüngen.
  • Behandlung unbekannter Rollen: Rollen wie 'planner' und 'critic' fallen nun elegant zurück, anstatt einen Absturz zu verursachen.
  • Streaming-Parser: Bietet saubere XML-Grenzen für das Streaming.
  • Konfigurierbare Kürzung: Ermöglicht die Festlegung einer maximalen Zeichenbegrenzung für große Tool-Argumente und Antworten.
  • Unterstützung für Entwickler-Rollen: Fügt Unterstützung für Rollen wie 'Claude Code', 'Codex' und 'OpenCode' hinzu.

Eine vollständige Liste aller 21 Korrekturen ist im README des Projekts verfügbar.

Ad

Konfiguration

Die Vorlage enthält konfigurierbare Variablen. Sie können über Befehlszeilenargumente gesetzt werden:

--chat-template-kwargs '{"enable_thinking":true,"auto_disable_thinking_with_tools":true,"max_tool_response_chars":8192}'

Kompatibilität & Testen

Die Vorlage wurde auf den folgenden Plattformen mit den angegebenen Mindestversionen getestet:

  • llama.cpp (b4242+)
  • Open WebUI (v0.4.8+)
  • vLLM (v0.6.4+)
  • Ollama (v0.5.0+)
  • LM Studio (v0.3.5+)
  • Text Generation WebUI

Sie ist mit allen Qwen-3.5-Modellen (35B, 27B, 14B, 9B, 4B und der Coder-Serie) kompatibel und abwärtskompatibel mit Qwen3 32B.

Source und Lizenz

Die Vorlage steht auf HuggingFace zum Download bereit unter barubary/qwen3.5-barubary-attuned-chat-template. Sie wird unter der Apache-2.0-Lizenz veröffentlicht, und der Entwickler freut sich über Feedback und Fehlerberichte.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung
Werkzeuge

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung

Eine neue Fähigkeit für OpenClaw-Agenten adressiert das häufige Problem, bei dem Agenten den nächsten Schritt identifizieren, aber bei 'Hier ist, was als Nächstes zu tun ist' stoppen und eine menschliche Übergabe erfordern. Die Fähigkeit ermöglicht es Agenten, bestimmte Aktionen selbst auszuführen, wie Registrieren, Posten, Antworten und Unterschreiben.

OpenClawRadar
Statespace: Erstellen Sie interaktive Web-Apps für OpenClaw-Agenten mit Markdown
Werkzeuge

Statespace: Erstellen Sie interaktive Web-Apps für OpenClaw-Agenten mit Markdown

Statespace ist ein kostenloses, quelloffenes Framework zum Erstellen und Teilen von KI-freundlichen Web-Apps, die OpenClaw-Agenten mit reinem Markdown navigieren und bedienen können. Es ermöglicht Ihnen, Werkzeuge, Komponenten und Anweisungen in Markdown-Dateien zu definieren, auf die Agenten über HTTP zugreifen.

OpenClawRadar
Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines
Werkzeuge

Klauenverdichter: 14-stufige Token-Kompressions-Engine für LLM-Pipelines

Claw Compactor ist eine Open-Source-LLM-Token-Komprimierungs-Engine, die eine 14-stufige Fusion-Pipeline verwendet, um eine durchschnittliche Kompression von 54 % ohne LLM-Inferenzkosten zu erreichen. Sie umfasst spezialisierte Kompressoren für Code, JSON, Protokolle, Diffs und Suchergebnisse mit reversiblen Komprimierungsfähigkeiten.

OpenClawRadar
Workflow-Orchestrator mit KI-CLI-Integration für Sysadmin-Aufgaben
Werkzeuge

Workflow-Orchestrator mit KI-CLI-Integration für Sysadmin-Aufgaben

Ein Entwickler hat einen dateibasierten Workflow-Orchestrator namens 'workflow' erstellt, der sich mit Claude Code, Codex CLI und Gemini CLI integriert. Er generiert, aktualisiert, korrigiert und verfeinert YAML-Workflows aus natürlichen Sprachbeschreibungen für Sysadmin-Aufgaben.

OpenClawRadar