ComfyUI Skill Permite a los Agentes de IA Encolar y Procesar por Lotes Renderizados de Imágenes mediante Lenguaje Natural

Un desarrollador ha lanzado una habilidad para ComfyUI que permite a los agentes de programación IA encolar, procesar por lotes y gestionar renderizados de imágenes directamente desde el chat. En lugar de cambiar manualmente a la interfaz de ComfyUI, los usuarios pueden pedir a su agente que maneje la construcción del flujo de trabajo, el envío de trabajos y el seguimiento hasta su finalización.
Cómo Funciona
La habilidad opera a través de una secuencia específica:
- El usuario le pide imágenes al agente
- El agente llama a la habilidad de ComfyUI como una herramienta
- La habilidad construye el JSON del flujo de trabajo a partir de las entradas del usuario
- Envía una solicitud POST a la API HTTP local de ComfyUI
- Realiza seguimiento hasta que se complete el renderizado
- Devuelve la ruta de salida al agente
Capacidades de Lenguaje Natural
Lo que distingue esto de un script básico de API es la capa de lenguaje natural. Los usuarios pueden emitir comandos como:
- "Haz 50 variaciones de este concepto con diferentes semillas, guárdalas en mi carpeta de conceptos"
- "Compara estos 4 prompts lado a lado a 1024x1024"
- "Renderiza todos estos a 20, 30 y 40 pasos para que pueda elegir el punto óptimo"
El agente traduce estas solicitudes en JSON real del flujo de trabajo de ComfyUI y maneja la gestión de colas, devolviendo las rutas de archivo cuando se completan los renderizados.
Configuración e Implementación
La habilidad es completamente local—nada sale de tu máquina—y funciona con lo que ya tengas cargado en ComfyUI. Para implementarla:
- Coloca la habilidad en la carpeta skills/ de tu espacio de trabajo de OpenClaw
- Actualiza el endpoint en SKILL.md
- Reinicia el gateway
El repositorio de código abierto está disponible en: https://github.com/Zambav/comfyui-skill-public
📖 Read the full source: r/openclaw
👀 Ver también

El Servidor MCP Permite a los Agentes de IA Realizar Compras Reales con Tarjetas Virtuales Efímeras
Un desarrollador ha creado un servidor MCP que permite a los agentes de IA realizar compras reales utilizando tarjetas Visa virtuales efímeras emitidas justo a tiempo. El sistema requiere aprobación del usuario mediante MFA y emite tarjetas bloqueadas para comerciantes específicos con un TTL de 15 minutos.

Títulos de artículos de Pokémon Showdown: Agentes de IA creados con APIs de LLM gratuitas y llamadas a herramientas
Un sistema que usa Llama 3, Qwen, Gemma a través de niveles gratuitos de API para jugar de forma autónoma batallas de Pokémon Showdown con llamadas a herramientas estructuradas, compatible con modos humano vs IA e IA vs IA.

Creación de una aplicación local de voz a texto para macOS con Claude Code: Caso de estudio de Vext
Un desarrollador pasó 3 meses construyendo Vext, una aplicación de voz a texto para macOS que usa Whisper en Apple Neural Engine. Claude Code ayudó con FFI entre Rust y Swift, optimización de Core ML y la arquitectura de atajos de teclado. La aplicación funciona 100% sin conexión, transcribe 60 segundos de audio en ~400ms.

Coding-Flashcards: más de 800 tarjetas Anki para Rust, SQLite, Godot y Wolfram Language
Más de 800 tarjetas didácticas en Markdown que cubren Rust, SQLite, Godot y el lenguaje Wolfram desde primeros principios, con scripts para convertir a mazos de Anki o PDFs.