다중 AI 에이전트 상태 드리프트 해결: 스냅샷 읽기 & 추가 전용 쓰기

문제 파악하기

다중 단계 또는 다중 에이전트 워크플로우를 구축할 때 흔히 발생하는 문제는 각 요소가 독립적으로는 작동하지만 단계 간에 연결되면 오류가 발생한다는 것입니다. 주요 증상은 다음과 같습니다:

처음에는 이러한 문제들이 프롬프트 문제, 온도 무작위성, 또는 불량 검색으로 오인되었지만, 근본 원인은 상태 드리프트였습니다.

대부분의 설정에서 N단계는 현재 존재하는 컨텍스트를 읽습니다. 문제는 컨텍스트가 불안정하다는 점입니다—특히 병렬 단계나 비동기 업데이트가 있을 때 더욱 그렇습니다.

"최신 상태"를 읽는 대신, 각 단계는 고정된 스냅샷에서 읽습니다. 예를 들어, 3단계는 "현재 메모리"를 읽지 않고 스냅샷 v2(고정)를 읽습니다. 이렇게 하면 실행이 결정론적이 됩니다.

공유 메모리를 변경하는 대신, 모든 단계는 덮어쓰지 않고 새로운 버전을 작성합니다. 따라서 v2 → 단계 → v3 생성, 그 다음 v3 → 다음 단계 → v4 생성. 이렇게 하면 다음과 같은 것이 가능해집니다:

이 구분이 중요했습니다. 이제 다음과 같이 처리합니다:

두 가지를 혼합하지 마세요.

전체 채팅 기록을 덤프하는 대신, 다음과 같은 내용을 저장합니다:

다른 모든 것은 필요할 때 파생됩니다.

온도가 주요 문제는 아니었습니다. 더 효과적인 방법은 다음과 같습니다:

이러한 변경 사항을 구현한 후:

저자는 다른 사람들이 이 문제를 어떻게 처리하고 있는지 묻습니다: 기록에서 상태를 재구성하는지, 벡터 검색을 사용하는지, 명시적 구조화된 상태를 저장하는지, 아니면 다른 방법을 사용하는지?

📖 Read the full source: r/LocalLLaMA