多段階AIエージェントの状態ドリフトを軽減する3つの手法

問題の特定

マルチステップまたはマルチエージェントのワークフローを構築する際、個別には機能するがステップ間で破綻するという一般的な問題があります。症状には以下が含まれます：

当初、これらの問題はプロンプトの問題、温度のランダム性、または不適切な検索と誤解されていましたが、根本原因は状態ドリフトでした。

ほとんどの設定では、ステップNが現在存在するコンテキストを読み取ります。問題は、コンテキストが不安定であることです。特に並列ステップや非同期更新がある場合に顕著です。

「最新の状態」を読み取る代わりに、各ステップは固定されたスナップショットから読み取ります。例えば、ステップ3は「現在のメモリ」を読み取らず、スナップショットv2（固定）を読み取ります。これにより実行が決定論的になります。

共有メモリを変更する代わりに、すべてのステップは上書きなしで新しいバージョンを書き込みます。つまり、v2 → ステップ → v3を生成し、次にv3 → 次のステップ → v4を生成します。これにより以下が可能になります：

この区別は重要でした。現在は以下を扱います：

これらを混在させないでください。

完全なチャット履歴をダンプする代わりに、以下のようなものを保存します：

その他すべては必要に応じて導出されます。

温度は主な問題ではありませんでした。より効果的だったのは：

これらの変更を実装した後：

著者は、他の人々がこれをどのように扱っているかを尋ねています：履歴からの状態の再構築、ベクトル検索の使用、明示的な構造化状態の保存、または他の何か？

📖 Read the full source: r/LocalLLaMA