Réduire dérive d'état agents IA: 3 techniques pratiques

Identifier le problème

Lors de la construction de flux de travail multi-étapes ou multi-agents, un problème courant est que les choses fonctionnent isolément mais échouent entre les étapes. Les symptômes incluent :

La même entrée produisant des sorties différentes entre les exécutions
Les agents « oublient » les décisions antérieures
Le débogage devient presque impossible

Initialement, ces problèmes étaient attribués à des défauts de prompt, à l'aléa de la température, ou à une mauvaise récupération, mais la cause racine était la dérive d'état.

Solutions pratiques qui ont fonctionné

Arrêter de se fier au « contexte le plus récent »

La plupart des configurations font que l'étape N lit le contexte existant à l'instant présent. Le problème est que ce contexte est instable—surtout avec des étapes parallèles ou des mises à jour asynchrones.

Introduire des lectures basées sur des instantanés

Au lieu de lire « l'état actuel », chaque étape lit à partir d'un instantané figé. Par exemple, l'étape 3 ne lit pas la « mémoire actuelle »—elle lit l'instantané v2 (fixe). Cela rend l'exécution déterministe.

Rendre les écritures en mode ajout uniquement

Au lieu de modifier une mémoire partagée, chaque étape écrit une nouvelle version sans écrasement. Ainsi, v2 → étape → produit v3, puis v3 → étape suivante → produit v4. Cela permet :

La relecture des flux
Le débogage précis des échecs
La comparaison des exécutions

Séparer « état » et « contexte »

Cette distinction a été cruciale. Maintenant, traitez :

État = structuré, persistant (décisions, sorties, variables)
Contexte = temporaire (ce que le modèle voit par étape)

Ne les mélangez pas.

Garder l'état minimal et structuré

Au lieu de vider l'historique complet du chat, stockez des éléments comme :

Objectif
Étape actuelle
Sorties jusqu'à présent
Décisions prises

Tout le reste est dérivé si nécessaire.

Utiliser la température stratégiquement

La température n'était pas le problème principal. Ce qui a mieux fonctionné :

Basse température (0–0,3) pour les étapes modifiant l'état
Température plus élevée uniquement pour les étapes « créatives » terminales

Résultats

Après la mise en œuvre de ces changements :

Les exécutions sont devenues reproductibles
La coordination multi-agents s'est améliorée
Le débogage est passé de la conjecture au traçable

L'auteur demande comment les autres gèrent cela : reconstruire l'état à partir de l'historique, utiliser la récupération vectorielle, stocker un état structuré explicite, ou autre chose ?

📖 Read the full source: r/LocalLLaMA