Qwen3.5 35B-A3B MoE ejecuta un flujo de trabajo agencial de 27 pasos localmente en hardware de gama media.

✍️ OpenClawRadar📅 Publicado: 25 de marzo de 2026🔗 Source
Qwen3.5 35B-A3B MoE ejecuta un flujo de trabajo agencial de 27 pasos localmente en hardware de gama media.
Ad

Demostración de flujo de trabajo agéntico local

Un desarrollador en r/LocalLLaMA reportó ejecutar exitosamente un flujo de trabajo agéntico complejo localmente usando Qwen3.5 35B-A3B MoE. El modelo ejecutó una cadena de procesamiento de video de 27 pasos de forma autónoma en hardware de gama media.

Detalles del flujo de trabajo

La tarea involucró procesar un video desde un solo comando en lenguaje natural:

  • Subir un video
  • Transcribir con Whisper
  • Editar los subtítulos
  • Incrustar subtítulos nuevamente en el video con estilo personalizado

El flujo de trabajo consistió en 27 llamadas secuenciales a herramientas incluyendo: extract_audio, transcribe, read_file, edit_file, burn_subtitles, más pasos de verificación. El modelo planificó, ejecutó, verificó cada paso y se autocorrigió cuando fue necesario.

Ad

Especificaciones técnicas

Hardware:

  • Estación de trabajo móvil Lenovo ThinkPad P53
  • Procesador Intel i7-9850H
  • Quadro RTX 3000 (6GB VRAM)
  • 48GB RAM DDR4 2666MT/s

Pila de software:

  • Implementación completamente local con llama.cpp + whisper.cpp
  • No se usaron APIs en la nube

Configuración del modelo:

  • Qwen3.5 35B-A3B MoE con cuantización Q4_K_M
  • Arquitectura MoE con ~3B parámetros activos por token
  • Cabe y ejecuta en 6GB VRAM con capas descargadas
  • Base de conocimiento completa de 35B parámetros

Resultados de rendimiento

El flujo de trabajo completo se ejecutó en aproximadamente 10 minutos, con la mayor parte del tiempo dedicado a inferencia. El desarrollador notó cero errores y cero intervención humana requerida durante la cadena de 27 pasos. La arquitectura MoE hizo esto factible en hardware de gama media manteniendo bajo el conteo de parámetros activos mientras conservaba la capacidad completa del modelo.

Esto demuestra que los flujos de trabajo agénticos locales se están volviendo prácticos en hardware de nivel consumidor, particularmente con modelos MoE que equilibran el conteo de parámetros activos para velocidad contra el conteo total de parámetros para capacidad.

📖 Leer la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Fundador de Startup Utiliza Agentes de IA para Atención al Cliente e Investigación de Competidores
Casos de uso

Fundador de Startup Utiliza Agentes de IA para Atención al Cliente e Investigación de Competidores

Un fundador de una startup automatizó el servicio al cliente conectando un agente de IA a la documentación, reduciendo el tiempo diario de 2 horas a 20 minutos, y configuró resúmenes semanales de investigación de competidores entregados a Slack.

OpenClawRadar
3 Barreras Reales Tras Semanas de Pruebas de OpenClaw para Automatización Empresarial
Casos de uso

3 Barreras Reales Tras Semanas de Pruebas de OpenClaw para Automatización Empresarial

Un usuario de Reddit informa tres bloqueadores tras semanas ejecutando OpenClaw en Windows 11 con Claude Haiku 4.5 + DeepSeek: la ejecución headless oculta las acciones del agente, las integraciones CRM fallan al transferir, y el agente orquestador solicita ejecución manual en lugar de actuar sobre los datos.

OpenClawRadar
Agente OpenClaw Implementa Bucle de Automejora Autónoma con Ciclos de Sueño Nocturnos.
Casos de uso

Agente OpenClaw Implementa Bucle de Automejora Autónoma con Ciclos de Sueño Nocturnos.

Un usuario de OpenClaw ha configurado su agente para ejecutar un 'ciclo de sueño' nocturno que escanea investigaciones de IA, reflexiona sobre el rendimiento e implementa mejoras seguras de forma autónoma. El ciclo cuesta aproximadamente $0.40 por noche utilizando enrutamiento de modelos con Haiku para escaneo y Opus para juicios.

OpenClawRadar
Estudio de caso: Uso de múltiples agentes de IA para construir una biblioteca de C++ en producción
Casos de uso

Estudio de caso: Uso de múltiples agentes de IA para construir una biblioteca de C++ en producción

Un desarrollador documentó un proceso de varios meses utilizando cuatro agentes de IA (Claude, ChatGPT, Gemini, Grok) con roles distintos para construir FAT-P, una biblioteca de solo encabezados en C++20 con 107 encabezados y cero dependencias externas. El sistema incluyó revisión cruzada, documentos de gobernanza escritos por IA y un rastreador de deméritos para codificar modos de falla.

OpenClawRadar