Reduza Derivação de Estado em Agentes IA Multi-etapas

Identificando o problema

Ao construir fluxos de trabalho de múltiplas etapas ou multiagente, um problema comum é que as coisas funcionam isoladamente, mas quebram entre as etapas. Os sintomas incluem:

Mesma entrada produzindo saídas diferentes entre execuções
Agentes "esquecendo" decisões anteriores
A depuração se tornando quase impossível

Inicialmente, esses problemas foram confundidos com questões de prompt, aleatoriedade de temperatura ou recuperação inadequada, mas a causa raiz era a deriva de estado.

Soluções práticas que funcionaram

Pare de depender do "contexto mais recente"

A maioria das configurações faz com que a etapa N leia qualquer contexto existente no momento. O problema é que o contexto é instável — especialmente com etapas paralelas ou atualizações assíncronas.

Introduza leituras baseadas em snapshot

Em vez de ler o "estado mais recente", cada etapa lê de um snapshot fixado. Por exemplo, a etapa 3 não lê a "memória atual" — ela lê o snapshot v2 (fixo). Isso torna a execução determinística.

Faça gravações apenas de acréscimo

Em vez de modificar a memória compartilhada, cada etapa grava uma nova versão sem sobrescritas. Então v2 → etapa → produz v3, depois v3 → próxima etapa → produz v4. Isso permite:

Reproduzir fluxos
Depurar falhas exatas
Comparar execuções

Separe "estado" vs "contexto"

Essa distinção foi crucial. Agora trate:

Estado = estruturado, persistente (decisões, saídas, variáveis)
Contexto = temporário (o que o modelo vê por etapa)

Não misture os dois.

Mantenha o estado mínimo + estruturado

Em vez de despejar todo o histórico de chat, armazene coisas como:

Objetivo
Etapa atual
Saídas até agora
Decisões tomadas

Tudo o mais é derivado, se necessário.

Use temperatura estrategicamente

A temperatura não era o principal problema. O que funcionou melhor:

Baixa temperatura (0–0,3) para etapas que alteram o estado
Temperatura mais alta apenas para etapas "criativas" finais

Resultados

Após implementar essas mudanças:

As execuções se tornaram reproduzíveis
A coordenação multiagente melhorou
A depuração passou de adivinhação para rastreável

O autor pergunta como outros estão lidando com isso: reconstruindo estado do histórico, usando recuperação vetorial, armazenando estado estruturado explícito ou algo mais?

📖 Read the full source: r/LocalLLaMA