Qwen3.5 35B-A3B MoE ejecuta un flujo de trabajo agencial de 27 pasos localmente en hardware de gama media.

Demostración de flujo de trabajo agéntico local
Un desarrollador en r/LocalLLaMA reportó ejecutar exitosamente un flujo de trabajo agéntico complejo localmente usando Qwen3.5 35B-A3B MoE. El modelo ejecutó una cadena de procesamiento de video de 27 pasos de forma autónoma en hardware de gama media.
Detalles del flujo de trabajo
La tarea involucró procesar un video desde un solo comando en lenguaje natural:
- Subir un video
- Transcribir con Whisper
- Editar los subtítulos
- Incrustar subtítulos nuevamente en el video con estilo personalizado
El flujo de trabajo consistió en 27 llamadas secuenciales a herramientas incluyendo: extract_audio, transcribe, read_file, edit_file, burn_subtitles, más pasos de verificación. El modelo planificó, ejecutó, verificó cada paso y se autocorrigió cuando fue necesario.
Especificaciones técnicas
Hardware:
- Estación de trabajo móvil Lenovo ThinkPad P53
- Procesador Intel i7-9850H
- Quadro RTX 3000 (6GB VRAM)
- 48GB RAM DDR4 2666MT/s
Pila de software:
- Implementación completamente local con llama.cpp + whisper.cpp
- No se usaron APIs en la nube
Configuración del modelo:
- Qwen3.5 35B-A3B MoE con cuantización Q4_K_M
- Arquitectura MoE con ~3B parámetros activos por token
- Cabe y ejecuta en 6GB VRAM con capas descargadas
- Base de conocimiento completa de 35B parámetros
Resultados de rendimiento
El flujo de trabajo completo se ejecutó en aproximadamente 10 minutos, con la mayor parte del tiempo dedicado a inferencia. El desarrollador notó cero errores y cero intervención humana requerida durante la cadena de 27 pasos. La arquitectura MoE hizo esto factible en hardware de gama media manteniendo bajo el conteo de parámetros activos mientras conservaba la capacidad completa del modelo.
Esto demuestra que los flujos de trabajo agénticos locales se están volviendo prácticos en hardware de nivel consumidor, particularmente con modelos MoE que equilibran el conteo de parámetros activos para velocidad contra el conteo total de parámetros para capacidad.
📖 Leer la fuente completa: r/LocalLLaMA
👀 Ver también

Fundador de Startup Utiliza Agentes de IA para Atención al Cliente e Investigación de Competidores
Un fundador de una startup automatizó el servicio al cliente conectando un agente de IA a la documentación, reduciendo el tiempo diario de 2 horas a 20 minutos, y configuró resúmenes semanales de investigación de competidores entregados a Slack.

3 Barreras Reales Tras Semanas de Pruebas de OpenClaw para Automatización Empresarial
Un usuario de Reddit informa tres bloqueadores tras semanas ejecutando OpenClaw en Windows 11 con Claude Haiku 4.5 + DeepSeek: la ejecución headless oculta las acciones del agente, las integraciones CRM fallan al transferir, y el agente orquestador solicita ejecución manual en lugar de actuar sobre los datos.

Agente OpenClaw Implementa Bucle de Automejora Autónoma con Ciclos de Sueño Nocturnos.
Un usuario de OpenClaw ha configurado su agente para ejecutar un 'ciclo de sueño' nocturno que escanea investigaciones de IA, reflexiona sobre el rendimiento e implementa mejoras seguras de forma autónoma. El ciclo cuesta aproximadamente $0.40 por noche utilizando enrutamiento de modelos con Haiku para escaneo y Opus para juicios.

Estudio de caso: Uso de múltiples agentes de IA para construir una biblioteca de C++ en producción
Un desarrollador documentó un proceso de varios meses utilizando cuatro agentes de IA (Claude, ChatGPT, Gemini, Grok) con roles distintos para construir FAT-P, una biblioteca de solo encabezados en C++20 con 107 encabezados y cero dependencias externas. El sistema incluyó revisión cruzada, documentos de gobernanza escritos por IA y un rastreador de deméritos para codificar modos de falla.