ComfyUI-Fähigkeit ermöglicht KI-Agenten das Einreihen und Stapelrendern von Bildern über natürliche Sprache

Ein Entwickler hat eine ComfyUI-Fähigkeit veröffentlicht, die KI-Codierungsagenten ermöglicht, Bildrenderings direkt aus dem Chat zu planen, zu stapeln und zu verwalten. Anstatt manuell zur ComfyUI-Oberfläche zu wechseln, können Benutzer ihren Agenten bitten, die Workflow-Erstellung, Auftragseinreichung und Abfrage bis zur Fertigstellung zu übernehmen.
Wie es funktioniert
Die Fähigkeit arbeitet in einer bestimmten Abfolge:
- Benutzer bittet den Agenten um Bilder
- Agent ruft die ComfyUI-Fähigkeit als Werkzeug auf
- Fähigkeit erstellt Workflow-JSON aus Benutzereingaben
- Sendet POST-Anfrage an lokale ComfyUI-HTTP-API
- Fragt ab, bis das Rendering abgeschlossen ist
- Gibt den Ausgabepfad an den Agenten zurück
Natürliche Sprachfähigkeiten
Was dies von einem einfachen API-Skript unterscheidet, ist die natürliche Sprachschicht. Benutzer können Befehle wie diese erteilen:
- "Erstelle 50 Variationen dieses Konzepts mit verschiedenen Seeds und speichere sie in meinem Konzepte-Ordner"
- "Vergleiche diese 4 Prompts nebeneinander bei 1024x1024"
- "Rendere alle davon mit 20, 30 und 40 Schritten, damit ich den optimalen Punkt auswählen kann"
Der Agent übersetzt diese Anfragen in tatsächliche ComfyUI-Workflow-JSON und übernimmt die Warteschlangenverwaltung, gibt Dateipfade zurück, wenn die Renderings abgeschlossen sind.
Einrichtung und Implementierung
Die Fähigkeit ist vollständig lokal – nichts verlässt Ihren Computer – und funktioniert mit allem, was Sie bereits in ComfyUI geladen haben. Zur Implementierung:
- Legen Sie die Fähigkeit in Ihren OpenClaw-Arbeitsbereichsordner skills/ ab
- Aktualisieren Sie den Endpunkt in SKILL.md
- Starten Sie das Gateway neu
Das Open-Source-Repository ist verfügbar unter: https://github.com/Zambav/comfyui-skill-public
📖 Read the full source: r/openclaw
👀 Siehe auch

ByteRover-Speicher-Plugin für OpenClaw: Native Integration mit semantischer Hierarchie
Das ByteRover Memory Plugin für OpenClaw bietet native, strukturierte Langzeitspeicherung über eine dreischichtige Architektur und semantische Hierarchie, die in Markdown-Dateien gespeichert wird. Es erreicht 92,2 % Abrufgenauigkeit und erfordert OpenClaw v2026.3.22+.

Open-Source-Claude-Fähigkeit für Management-Consulting-Frameworks und Fallstudien
Ein kostenloses, MIT-lizenziertes Claude-Skill bietet strukturiertes Referenzmaterial für Management-Consulting-Arbeit, einschließlich Frameworks, Branchenkontext und Fallstudien. Das Projekt besteht aus 80+ Markdown-Dateien, die nach Domänen organisiert sind, und sucht Mitwirkende, um die Abdeckung zu erweitern.
Gigacatalyst: Integrieren Sie einen KI-Builder in Ihre SaaS, damit Benutzer benutzerdefinierte Workflows erstellen können
Gigacatalyst ermöglicht es Ihnen, einen KI-gestützten App-Builder in Ihre SaaS-Lösung einzubetten. Nicht-technische Benutzer beschreiben Abläufe in natürlicher Sprache, und das System generiert kontrollierte Apps unter Verwendung Ihrer APIs, Ihres Datenmodells und Ihres Designsystems – mit integriertem Authentifizierung, Mandantenisolierung und Versionskontrolle.

OpenClaw Guild: Mehrbenutzer-AI-Agenten-Server für Teams
OpenClaw Guild erweitert das Einzelbenutzer-OpenClaw zu einem Mehrbenutzer-AI-Server mit rollenbasierter Zugriffskontrolle, isolierten Daten pro Agent und einem 4-stufigen Speichersystem. Es beinhaltet ein Web-Admin-Dashboard und Docker-compose-Bereitstellung für einen 15-minütigen Einrichtungsprozess.