3 метода снизить дрейф состояния в ИИ-агентах

Выявление проблемы

При создании многошаговых или многозадачных рабочих процессов часто возникает проблема: всё работает изолированно, но ломается между шагами. Симптомы включают:

Одинаковый ввод даёт разный вывод при разных запусках
Агенты «забывают» ранее принятые решения
Отладка становится почти невозможной

Изначально эти проблемы ошибочно принимали за проблемы с промптами, случайность температуры или плохой поиск, но коренной причиной был дрейф состояния.

Практические решения, которые сработали

Перестаньте полагаться на «последний контекст»

В большинстве настроек шаг N читает любой существующий на данный момент контекст. Проблема в том, что контекст нестабилен — особенно при параллельных шагах или асинхронных обновлениях.

Введите чтение на основе снимков

Вместо чтения «последнего состояния» каждый шаг читает из зафиксированного снимка. Например, шаг 3 не читает «текущую память» — он читает снимок v2 (фиксированный). Это делает выполнение детерминированным.

Делайте записи исключительно добавлением

Вместо изменения общей памяти каждый шаг записывает новую версию без перезаписи. Так v2 → шаг → создаёт v3, затем v3 → следующий шаг → создаёт v4. Это позволяет:

Воспроизводить потоки
Отлаживать точные сбои
Сравнивать запуски

Разделите «состояние» и «контекст»

Это различие было ключевым. Теперь рассматривайте:

Состояние = структурированное, постоянное (решения, выводы, переменные)
Контекст = временный (то, что модель видит на каждом шаге)

Не смешивайте их.

Держите состояние минимальным и структурированным

Вместо сброса полной истории чата сохраняйте такие вещи, как:

Цель
Текущий шаг
Выводы на данный момент
Принятые решения

Всё остальное выводится при необходимости.

Используйте температуру стратегически

Температура не была основной проблемой. Что сработало лучше:

Низкая температура (0–0,3) для шагов, изменяющих состояние
Более высокая температура только для «творческих» конечных шагов

Результаты

После внедрения этих изменений:

Запуски стали воспроизводимыми
Координация между агентами улучшилась
Отладка превратилась из гадания в отслеживаемый процесс

Автор спрашивает, как другие справляются с этим: восстанавливают состояние из истории, используют векторный поиск, хранят явное структурированное состояние или что-то ещё?

📖 Read the full source: r/LocalLLaMA