Qwen3 27B übertrifft Gemma 4 26B in echtem Tool-Einsatz für lokale KI-Videopipeline

✍️ OpenClawRadar📅 Veröffentlicht: 13. Mai 2026🔗 Source
Ad

Am Wochenende veröffentlichte All About AI einen detaillierten Leitfaden zu einer 100% lokalen Fireship-ähnlichen Video-Automatisierungspipeline. Die wichtigste Erkenntnis: Die Zuverlässigkeit von Tool-Calling unterschied sich stark zwischen den beiden getesteten Modellen.

Tool-Calling: Qwen3 27B vs Gemma 4 26B

Gemma 4 26B geriet wiederholt in Tool-Call-Schleifen und verschwendete Tokens für unnötige Überlegungen. Qwen3 (genauer gesagt Qwen 3.6 27B?) handhabte dieselbe Orchestrierung sauber, ohne verschwendete Denk-Tokens. Die Diskrepanz zwischen Benchmark-Zahlen und tatsächlicher Agentenworkflow-Leistung ist erheblich – Tool-Call-Schleifen fressen sowohl Zeit als auch GPU-Speicher.

Wenn Sie einen Tool-Calling-Stack (OpenClaw, Aider oder eine benutzerdefinierte Schleife) betreiben, spielt die Modellwahl eine größere Rolle, als synthetische Benchmarks vermuten lassen. Der Autor bittet ausdrücklich um Fehlerraten für Qwen3-Tool-Calling im Vergleich zu DeepSeek V4 bei bestimmten Stacks.

Ad

Bildgenerierung: Said Image Turbo

Für Bilder verwendete die Pipeline Said Image Turbo von Hugging Face – offene Gewichte, keine API-Kosten. Es funktioniert gut für Meme-artige Karten, aber für Porträtaufnahmen sollte man stattdessen Flux oder Seedream verwenden.

Orchestrierung: OpenCode mit 174K Kontext

Die gesamte Pipeline wurde mit OpenCode orchestriert. Der Kontextfenster erreichte 174K Tokens, und die Aufgabenliste wurde nicht in einem Durchgang vollständig abgearbeitet. Der Bediener verließ den Vorgang mitten im Lauf und kam zu einem Teilergebnis zurück – eine ehrliche Darstellung des aktuellen Stands autonomer KI-Werkzeuge.

Remote-Ausführung

Wenn Sie ein 27B-Modell nicht lokal ausführen können, ist Qwen3 bei mehreren Inference-Anbietern verfügbar, sodass Sie dieselben Gewichte und dasselbe Tool-Calling-Verhalten ohne die GPU-Investition erhalten.

📖 Vollständige Quelle lesen: r/LocalLLaMA

Ad

👀 Siehe auch

Claude Code v2.1.79 OAuth-Anmeldung nach automatischem Update defekt: Problemumgehung und Lösung
Nachrichten

Claude Code v2.1.79 OAuth-Anmeldung nach automatischem Update defekt: Problemumgehung und Lösung

Claude Code v2.1.79 hat einen bestätigten OAuth-Login-Fehler, bei dem die CLI nach der Browser-Autorisierung eine Zeitüberschreitung aufweist. Das Problem rührt daher, dass der native Installer automatisch auf diese Version aktualisiert, und die Lösung besteht darin, auf v2.1.75 zurückzustufen, indem die native Installation entfernt wird.

OpenClawRadar
Undokumentierter Fehler im Apollo-11-Lenkcomputercode mithilfe von KI und Spezifikationssprache gefunden
Nachrichten

Undokumentierter Fehler im Apollo-11-Lenkcomputercode mithilfe von KI und Spezifikationssprache gefunden

Forscher entdeckten einen Ressourcensperrfehler im Gyroskopsteuerungscode des Apollo Guidance Computers, der 57 Jahre lang unentdeckt blieb, indem sie Claude AI und die Allium-Spezifikationssprache nutzten, um 130.000 Zeilen Assembler-Code zu analysieren.

OpenClawRadar
KI-Datenzentren Wasserverbrauch in Kalifornien: Schätzungen aus Physik und KI-Modellen
Nachrichten

KI-Datenzentren Wasserverbrauch in Kalifornien: Schätzungen aus Physik und KI-Modellen

Eine Analyse des California WaterBlog, die Physik und vier KI-Modelle nutzt, schätzt den Wasserverbrauch von KI-Rechenzentren in Kalifornien auf 2.300–400.000 Acre-Fuß/Jahr, mit einem realistischen Bereich von 32.000–290.000 Acre-Fuß/Jahr – bescheiden im Vergleich zur Landwirtschaft.

OpenClawRadar
llama.cpp Q8_0-Quantisierung erzielt 3,1-fache Beschleunigung auf Intel Arc GPUs durch SYCL-Reorder-Fix
Nachrichten

llama.cpp Q8_0-Quantisierung erzielt 3,1-fache Beschleunigung auf Intel Arc GPUs durch SYCL-Reorder-Fix

Eine Korrektur für llama.cpps SYCL-Backend bringt die Q8_0-Quantisierung auf Intel Arc GPUs von 21 % auf 66 % der theoretischen Speicherbandbreite und erreicht 15,24 Token/Sekunde gegenüber zuvor 4,88 Token/Sekunde auf einem Arc Pro B70 mit Qwen3.5-27B.

OpenClawRadar