Qwen3.5 35B-A3B MoE führt 27-stufige agentenbasierte Workflows lokal auf Mittelklasse-Hardware aus

✍️ OpenClawRadar📅 Veröffentlicht: 25. März 2026🔗 Source

Demonstration eines lokalen agentenbasierten Workflows

Ein Entwickler auf r/LocalLLaMA berichtete über die erfolgreiche lokale Ausführung eines komplexen agentenbasierten Workflows mit Qwen3.5 35B-A3B MoE. Das Modell führte eine 27-stufige Videoverarbeitungskette autonom auf Mittelklasse-Hardware aus.

Workflow-Details

Die Aufgabe umfasste die Verarbeitung eines Videos anhand einer einzigen natürlichen Sprachaufforderung:

Ein Video hochladen
Mit Whisper transkribieren
Die Untertitel bearbeiten
Untertitel mit individuellem Stil zurück in das Video einbrennen

Der Workflow bestand aus 27 sequenziellen Tool-Aufrufen, darunter: extract_audio, transcribe, read_file, edit_file, burn_subtitles sowie Verifizierungsschritte. Das Modell plante, führte aus, überprüfte jeden Schritt und korrigierte sich bei Bedarf selbst.

Technische Spezifikationen

Hardware:

Lenovo ThinkPad P53 Mobile Workstation
Intel i7-9850H Prozessor
Quadro RTX 3000 (6GB VRAM)
48GB DDR4 2666MT/s RAM

Software-Stack:

Vollständige lokale Implementierung mit llama.cpp + whisper.cpp
Keine Cloud-APIs verwendet

Modellkonfiguration:

Qwen3.5 35B-A3B MoE mit Q4_K_M-Quantisierung
MoE-Architektur mit ~3B aktiven Parametern pro Token
Passt und läuft auf 6GB VRAM mit ausgelagerten Layern
Vollständige 35B-Parameter-Wissensbasis

Leistungsergebnisse

Der vollständige Workflow lief in etwa 10 Minuten, wobei die meiste Zeit für Inferenz aufgewendet wurde. Der Entwickler stellte null Fehler und null menschliches Eingreifen während der 27-stufigen Kette fest. Die MoE-Architektur machte dies auf Mittelklasse-Hardware möglich, indem die Anzahl aktiver Parameter niedrig gehalten wurde, während die volle Modellfähigkeit erhalten blieb.

Dies zeigt, dass lokale agentenbasierte Workflows auf Consumer-Hardware praktikabel werden, insbesondere mit MoE-Modellen, die die Anzahl aktiver Parameter für Geschwindigkeit gegen die volle Parameteranzahl für Fähigkeiten abwägen.

📖 Read the full source: r/LocalLLaMA

👀 Siehe auch

Anwendungsfälle

OpenClaw + Claude Code/Codex im Tandem: ein reales Beispiel für das Beste aus beiden Welten

Eine praktische Architektur für den Einsatz von Claude Code/Codex zum Bau und OpenClaw zum Betrieb einer Leadgenerierungs- und Outreach-Engine. Konkrete Toolauswahl, Kostenaufschlüsselung und Agentendesign.

19. Juni 2026, 00:16 UTC

OpenClawRadar

Anwendungsfälle

SkiTomorrow.ai: Eine Skireise-Entscheidungsmaschine, erstellt mit Claude Code

SkiTomorrow.ai ist ein kostenloses Webtool, das 234 Skigebiete weltweit basierend auf Live-Schneevorhersagen, Reiseentfernung und Kosten bewertet und dann personalisierte Ranglisten liefert. Der Entwickler hat es vollständig mit Claude Code erstellt und spezifische Workflow-Einblicke geteilt.

28. März 2026, 20:45 UTC

OpenClawRadar

Anwendungsfälle

OpenClaw Lebensmittelbestellungsfehler: Einheitenverwirrung mit MCP-Server

Ein Benutzer gab OpenClaw seine Kreditkartendaten, um wöchentliche Lebensmitteleinkäufe über einen MCP-Server zu erledigen. Nach drei Monaten einwandfreier Bestellungen bestellte das System kürzlich 2 kg Knoblauch statt 2 Köpfe, weil die Produktseite standardmäßig Kilogramm vorgab.

14. Mai 2026, 06:17 UTC

OpenClawRadar

Anwendungsfälle

Benutzerdefinierte OpenClaw-Fähigkeiten für CRM- und CMS-Integration

Ein Entwickler erstellte benutzerdefinierte OpenClaw-Fähigkeiten, um mit eigenen CRM- und CMS-Systemen zu interagieren, was automatisierte Lead-Generierung und Inhaltserstellung mit menschlicher Überwachung ermöglicht. Die Einrichtung dauerte einen Tag.

18. März 2026, 11:45 UTC

OpenClawRadar