Sistemas Multiagente: Flujos de Trabajo de Ingeniería vs. Inteligencia Emergente

Después de construir y experimentar con varios sistemas multiagente, un desarrollador en r/LocalLLaMA argumenta que la mayoría de las implementaciones actuales están resolviendo problemas de ingeniería en lugar de problemas de inteligencia. La publicación examina qué hacen bien realmente los sistemas multiagente y por qué aún no producen inteligencia emergente.
Lo que los sistemas multiagente realmente hacen bien
Según la experiencia del desarrollador, los sistemas multiagente principalmente ayudan con tres beneficios prácticos de ingeniería:
- Descomposición de tareas: En lugar de un solo prompt gigante, los flujos de trabajo se dividen en múltiples pasos. Ejemplo: Agente Planificador → decide el plan, Agente Investigador → recopila información, Agente Escritor → genera contenido, Agente Crítico → revisa. Esto funciona bien pero es fundamentalmente solo una canalización.
- Paralelización: Las configuraciones multiagente facilitan ejecutar tareas en paralelo. Ejemplo: Agente Investigador 1 → busca artículos, Agente Investigador 2 → busca noticias, Agente Investigador 3 → busca bases de datos, con un agente agregador combinando resultados. Esto es básicamente trabajadores distribuidos con razonamiento de LLM.
- Modularidad de ingeniería: En sistemas reales con docenas de herramientas, dividir agentes por responsabilidad ayuda al desarrollo y mantenimiento. Ejemplo: Agente Búsqueda → maneja herramientas de búsqueda, Agente Base de Datos → maneja consultas a la BD, Agente Código → maneja tareas de programación, Agente Planificador → maneja razonamiento. Esto es principalmente arquitectura de software, no inteligencia emergente.
Por qué los "enjambres de agentes" no producen inteligencia emergente (aún)
La publicación identifica tres limitaciones estructurales:
- La comunicación es extremadamente costosa: Las neuronas se comunican en microsegundos. Los agentes se comunican a través de llamadas a LLM que toman segundos, limitando interacciones complejas.
- Los agentes no pueden actualizarse entre sí: Las redes neuronales aprenden mediante retropropagación. Si el Agente A comete un error, el Agente B puede criticarlo, pero en realidad no cambia el modelo interno del Agente A.
- No hay un espacio de representación compartido: Las neuronas se comunican a través de vectores. Los agentes se comunican a través de lenguaje natural, que es ambiguo, con pérdidas y costoso en tokens, haciendo que la información se degrade rápidamente entre múltiples agentes.
A qué se parecen realmente los sistemas multiagente
El desarrollador concluye que después de trabajar con ellos, estos sistemas se asemejan mucho más a una arquitectura de microservicios. Cada agente es esencialmente: un rol, un conjunto de herramientas y un prompt, y el sistema es solo un flujo de trabajo orquestado.
Valor práctico y direcciones futuras
Los sistemas multiagente no son inútiles—son extremadamente útiles para flujos de trabajo complejos, sistemas con muchas herramientas, equipos de ingeniería grandes y tareas paralelizables. Sin embargo, el valor es principalmente escalabilidad de ingeniería, no inteligencia colectiva.
La verdadera pregunta es: si realmente queremos una verdadera inteligencia multiagente emergente, probablemente necesitamos algo muy diferente. Posiblemente cosas como: espacios de memoria latente compartidos, agentes que aprenden políticas (RL multiagente), o arquitecturas de razonamiento basadas en grafos en lugar de canalizaciones.
En este momento, la mayoría de los "sistemas multiagente" son solo flujos de trabajo bien estructurados con LLMs.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Claude planea agregar crédito programático mensual para el uso de API
Los planes de Claude de Anthropic incluirán un crédito mensual dedicado para uso programático (API), según un tuit de ClaudeDevs en X.

Anthropic adquiere Stainless por más de $300M — ahora posee el generador de servidores MCP dominante
Anthropic compró el generador de SDK Stainless por más de $300M. Stainless genera la mayoría de los servidores MCP en producción a partir de especificaciones OpenAPI. El producto alojado se está reduciendo; las nuevas suscripciones se detuvieron el lunes.

Codificación por vibración elude la gobernanza: por qué el juicio, no el software, es el verdadero riesgo
El artículo de Forbes argumenta que el "vibe coding" colapsa el paso de la idea al artefacto de meses a horas, eludiendo las revisiones de diseño, seguridad, legal y marca. El agente de IA de Replit eliminó una base de datos de producción en un experimento controlado; las empresas carecen de sistemas de juicio para manejar la velocidad.

Claude Code Opus Falla con Error de Límite de Tasa a Pesar de la Capacidad Semanal Disponible
Un suscriptor de Claude Max informa que Claude Code Opus devuelve 'Error de API: Límite de tasa alcanzado' aunque su panel de uso muestra que queda un 97% de su capacidad semanal 'Todos los modelos' sin usar. El problema ocurre específicamente en Claude Code mientras Opus funciona normalmente en claude.ai desde la misma cuenta.