Sistemas Multiagente: Flujos de Trabajo vs. Inteligencia Emergente

Después de construir y experimentar con varios sistemas multiagente, un desarrollador en r/LocalLLaMA argumenta que la mayoría de las implementaciones actuales están resolviendo problemas de ingeniería en lugar de problemas de inteligencia. La publicación examina qué hacen bien realmente los sistemas multiagente y por qué aún no producen inteligencia emergente.

Lo que los sistemas multiagente realmente hacen bien

Según la experiencia del desarrollador, los sistemas multiagente principalmente ayudan con tres beneficios prácticos de ingeniería:

Descomposición de tareas: En lugar de un solo prompt gigante, los flujos de trabajo se dividen en múltiples pasos. Ejemplo: Agente Planificador → decide el plan, Agente Investigador → recopila información, Agente Escritor → genera contenido, Agente Crítico → revisa. Esto funciona bien pero es fundamentalmente solo una canalización.
Paralelización: Las configuraciones multiagente facilitan ejecutar tareas en paralelo. Ejemplo: Agente Investigador 1 → busca artículos, Agente Investigador 2 → busca noticias, Agente Investigador 3 → busca bases de datos, con un agente agregador combinando resultados. Esto es básicamente trabajadores distribuidos con razonamiento de LLM.
Modularidad de ingeniería: En sistemas reales con docenas de herramientas, dividir agentes por responsabilidad ayuda al desarrollo y mantenimiento. Ejemplo: Agente Búsqueda → maneja herramientas de búsqueda, Agente Base de Datos → maneja consultas a la BD, Agente Código → maneja tareas de programación, Agente Planificador → maneja razonamiento. Esto es principalmente arquitectura de software, no inteligencia emergente.

Por qué los "enjambres de agentes" no producen inteligencia emergente (aún)

La publicación identifica tres limitaciones estructurales:

La comunicación es extremadamente costosa: Las neuronas se comunican en microsegundos. Los agentes se comunican a través de llamadas a LLM que toman segundos, limitando interacciones complejas.
Los agentes no pueden actualizarse entre sí: Las redes neuronales aprenden mediante retropropagación. Si el Agente A comete un error, el Agente B puede criticarlo, pero en realidad no cambia el modelo interno del Agente A.
No hay un espacio de representación compartido: Las neuronas se comunican a través de vectores. Los agentes se comunican a través de lenguaje natural, que es ambiguo, con pérdidas y costoso en tokens, haciendo que la información se degrade rápidamente entre múltiples agentes.

A qué se parecen realmente los sistemas multiagente

El desarrollador concluye que después de trabajar con ellos, estos sistemas se asemejan mucho más a una arquitectura de microservicios. Cada agente es esencialmente: un rol, un conjunto de herramientas y un prompt, y el sistema es solo un flujo de trabajo orquestado.

Valor práctico y direcciones futuras

Los sistemas multiagente no son inútiles—son extremadamente útiles para flujos de trabajo complejos, sistemas con muchas herramientas, equipos de ingeniería grandes y tareas paralelizables. Sin embargo, el valor es principalmente escalabilidad de ingeniería, no inteligencia colectiva.

La verdadera pregunta es: si realmente queremos una verdadera inteligencia multiagente emergente, probablemente necesitamos algo muy diferente. Posiblemente cosas como: espacios de memoria latente compartidos, agentes que aprenden políticas (RL multiagente), o arquitecturas de razonamiento basadas en grafos en lugar de canalizaciones.

En este momento, la mayoría de los "sistemas multiagente" son solo flujos de trabajo bien estructurados con LLMs.

📖 Read the full source: r/LocalLLaMA

Sistemas Multiagente: Flujos de Trabajo de Ingeniería vs. Inteligencia Emergente

Lo que los sistemas multiagente realmente hacen bien

Por qué los "enjambres de agentes" no producen inteligencia emergente (aún)

A qué se parecen realmente los sistemas multiagente

Valor práctico y direcciones futuras

👀 Ver también

Claude planea agregar crédito programático mensual para el uso de API

Anthropic adquiere Stainless por más de $300M — ahora posee el generador de servidores MCP dominante

Codificación por vibración elude la gobernanza: por qué el juicio, no el software, es el verdadero riesgo

Claude Code Opus Falla con Error de Límite de Tasa a Pesar de la Capacidad Semanal Disponible