Sistemas Multiagentes: Fluxos de Trabalho de Engenharia vs. Inteligência Emergente

Após construir e experimentar com vários sistemas multiagente, um desenvolvedor no r/LocalLLaMA argumenta que a maioria das implementações atuais está resolvendo problemas de engenharia, e não problemas de inteligência. O post examina o que os sistemas multiagente realmente fazem bem e por que eles ainda não produzem inteligência emergente.
O que os Sistemas Multiagente Realmente Fazem Bem
Da experiência do desenvolvedor, os sistemas multiagente ajudam principalmente com três benefícios práticos de engenharia:
- Decomposição de tarefas: Em vez de um prompt gigante, os fluxos de trabalho são divididos em várias etapas. Exemplo: Agente Planejador → decide o plano, Agente de Pesquisa → coleta informações, Agente Escritor → gera conteúdo, Agente Crítico → revisa. Isso funciona bem, mas é fundamentalmente apenas um pipeline.
- Paralelização: Configurações multiagente facilitam a execução de tarefas em paralelo. Exemplo: Agente de Pesquisa 1 → pesquisa artigos, Agente de Pesquisa 2 → pesquisa notícias, Agente de Pesquisa 3 → pesquisa bancos de dados, com um agente agregador combinando os resultados. Isso é basicamente trabalhadores distribuídos com raciocínio de LLM.
- Modularidade de engenharia: Em sistemas reais com dezenas de ferramentas, dividir agentes por responsabilidade ajuda no desenvolvimento e manutenção. Exemplo: Agente de Busca → lida com ferramentas de busca, Agente de Banco de Dados → lida com consultas ao BD, Agente de Código → lida com tarefas de programação, Agente Planejador → lida com raciocínio. Isso é principalmente arquitetura de software, não inteligência emergente.
Por que "Enxames de Agentes" Não Produzem Inteligência Emergente (Ainda)
O post identifica três limitações estruturais:
- A comunicação é extremamente cara: Neurônios se comunicam em microssegundos. Agentes se comunicam por meio de chamadas de LLM que levam segundos, limitando interações complexas.
- Agentes não podem se atualizar mutuamente: Redes neurais aprendem por retropropagação. Se o Agente A comete um erro, o Agente B pode criticá-lo, mas isso não muda realmente o modelo interno do Agente A.
- Não há espaço de representação compartilhado: Neurônios se comunicam por meio de vetores. Agentes se comunicam por meio de linguagem natural, que é ambígua, com perdas e cara em tokens, fazendo com que a informação se degrade rapidamente entre múltiplos agentes.
Com o que os Sistemas Multiagente Realmente se Parecem
O desenvolvedor conclui que, após trabalhar com eles, esses sistemas se parecem muito mais com uma arquitetura de microsserviços. Cada agente é essencialmente: um papel, um conjunto de ferramentas e um prompt, e o sistema é apenas um fluxo de trabalho orquestrado.
Valor Prático e Direções Futuras
Os sistemas multiagente não são inúteis — eles são extremamente úteis para fluxos de trabalho complexos, sistemas com muitas ferramentas, grandes equipes de engenharia e tarefas paralelizáveis. No entanto, o valor é principalmente escalabilidade de engenharia, não inteligência coletiva.
A verdadeira questão é: se realmente queremos verdadeira inteligência emergente multiagente, provavelmente precisamos de algo muito diferente. Possivelmente coisas como: espaços de memória latente compartilhados, agentes que aprendem políticas (RL multiagente) ou arquiteturas de raciocínio baseadas em grafos em vez de pipelines.
No momento, a maioria dos "sistemas multiagente" são apenas fluxos de trabalho bem estruturados com LLMs.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Meta adquire Moltbook, um fórum no estilo Reddit para agentes de IA
A Meta adquiriu a Moltbook, uma plataforma de fórum no estilo Reddit projetada especificamente para agentes de IA. A aquisição foi confirmada na terça-feira, com os criadores da Moltbook ingressando nos Superintelligence Labs da Meta.

Atualizações do Prompt do Sistema Claude Code 2.1.72: Novos Modos de Execução e Melhorias de Verificação
A versão 2.1.72 do Claude Code apresenta novos prompts de sistema para o modo Automático (execução contínua de tarefas) e modo Resumido (execução estilo Codex), além de expansões significativas para o agente especialista em Verificação com padrões de falha documentados e requisitos de saída estruturados.

GitHub Copilot Remove Modelos Opus do Plano Pro, Pausa Novas Inscrições
O GitHub está removendo os modelos Opus do plano Copilot Pro e pausando novas inscrições para os planos Pro, Pro+ e Estudante. O Opus 4.7 permanece disponível no Pro+, enquanto os planos Pro+ agora oferecem mais de 5 vezes os limites de uso do Pro.

Comparativo de Inferência M5 Max vs M3 Max para Modelos Qwen no oMLX
Benchmarks comparando MacBook Pros M5 Max e M3 Max executando modelos Qwen 3.5 via oMLX v0.2.23 mostram o M5 Max entregando geração de tokens 1,4-1,7x mais rápida e preenchimento prévio até 4x mais rápido em contextos longos.