ComfyUI-Agenten: Stapelrendern via Sprachbefehle

Ein Entwickler hat eine ComfyUI-Fähigkeit veröffentlicht, die KI-Codierungsagenten ermöglicht, Bildrenderings direkt aus dem Chat zu planen, zu stapeln und zu verwalten. Anstatt manuell zur ComfyUI-Oberfläche zu wechseln, können Benutzer ihren Agenten bitten, die Workflow-Erstellung, Auftragseinreichung und Abfrage bis zur Fertigstellung zu übernehmen.

Wie es funktioniert

Die Fähigkeit arbeitet in einer bestimmten Abfolge:

Benutzer bittet den Agenten um Bilder
Agent ruft die ComfyUI-Fähigkeit als Werkzeug auf
Fähigkeit erstellt Workflow-JSON aus Benutzereingaben
Sendet POST-Anfrage an lokale ComfyUI-HTTP-API
Fragt ab, bis das Rendering abgeschlossen ist
Gibt den Ausgabepfad an den Agenten zurück

Natürliche Sprachfähigkeiten

Was dies von einem einfachen API-Skript unterscheidet, ist die natürliche Sprachschicht. Benutzer können Befehle wie diese erteilen:

"Erstelle 50 Variationen dieses Konzepts mit verschiedenen Seeds und speichere sie in meinem Konzepte-Ordner"
"Vergleiche diese 4 Prompts nebeneinander bei 1024x1024"
"Rendere alle davon mit 20, 30 und 40 Schritten, damit ich den optimalen Punkt auswählen kann"

Der Agent übersetzt diese Anfragen in tatsächliche ComfyUI-Workflow-JSON und übernimmt die Warteschlangenverwaltung, gibt Dateipfade zurück, wenn die Renderings abgeschlossen sind.

Einrichtung und Implementierung

Die Fähigkeit ist vollständig lokal – nichts verlässt Ihren Computer – und funktioniert mit allem, was Sie bereits in ComfyUI geladen haben. Zur Implementierung:

Legen Sie die Fähigkeit in Ihren OpenClaw-Arbeitsbereichsordner skills/ ab
Aktualisieren Sie den Endpunkt in SKILL.md
Starten Sie das Gateway neu

Das Open-Source-Repository ist verfügbar unter: https://github.com/Zambav/comfyui-skill-public

📖 Read the full source: r/openclaw

ComfyUI-Fähigkeit ermöglicht KI-Agenten das Einreihen und Stapelrendern von Bildern über natürliche Sprache

Wie es funktioniert

Natürliche Sprachfähigkeiten

Einrichtung und Implementierung

👀 Siehe auch

Außerhalb des Stromnetzes: Nutzung von Telefonhardware für Offline-AI-Anwendungen

Erkundung von LiveDocs: Ein KI-natives Datenanalyse-Notebook

Claude Skills Hub: Durchsuchbares Repository für 789+ Claude Code Skills und 10 autonome Agenten

Code-Graph-MCP: Open-Source-MCP-Server reduziert Claude-Code-Token-Verbrauch um 40-60%