SOUL.md 규칙이 긴 AI 에이전트 세션에서 표류하는 문제와 해결 방법

SOUL.md 규칙이 처음 10-15개의 메시지에서는 완벽하게 작동하지만, 세션 후반에 무시된다면 시스템이 고장난 것이 아니라 세션이 규칙을 초월한 것입니다. 이는 SOUL.md가 세션 시작 시 시스템 프롬프트의 일부로 한 번 로드되지만, 대화 컨텍스트가 증가함에 따라(20번째 메시지쯤에는 수천 개의 토큰) 모델이 초기 프롬프트보다 최근 메시지 패턴에 더 많은 주의를 기울이기 때문입니다.
긴 세션에서 SOUL.md 규칙이 벗어나는 이유
첫 번째 메시지에서는 SOUL.md가 가장 큰 영향력을 발휘합니다. 모델은 이를 주의 깊게 읽고 따릅니다. "절대 'absolutely'라고 말하지 마세요", "나의 어조에 맞추세요", "직설적으로, 불필요한 말은 하지 마세요"와 같은 규칙들이 완벽하게 작동합니다. 20-30번째 메시지가 되면 에이전트는 점차 벗어나기 시작합니다—"absolutely"가 다시 스며들고, 응답이 길어지며, 불필요한 말이 돌아옵니다. SOUL.md는 기술적으로 여전히 존재하지만, 이후에 발생한 모든 것에 의해 가려집니다.
첫 날에 주어진 직무 설명서를 생각해 보세요. 3주가 지나면 직원은 매일 아침 그것을 다시 읽지 않습니다—그들은 최근 패턴을 바탕으로 옳다고 느껴지는 일을 합니다. 지난 10번의 대화가 길고 상세했다면, 에이전트는 SOUL.md가 "간결하게"라고 지시했더라도 길고 상세한 방식으로 기본 응답합니다.
주요 해결책: /new를 적극적으로 사용하세요
이것은 문제의 80%를 해결하며 비용이 들지 않습니다. 대부분의 사람들은 /new를 상황이 망가졌을 때의 최후의 수단으로 여깁니다. 대신, 각각의 다른 작업 전에 지속적으로 사용하세요:
- 연구? /new
- 캐주얼 채팅으로 돌아가기? /new
- 이메일 초안 작성이 필요? /new
에이전트의 어조가 벗어나기 시작할 때마다, /new를 입력하면 규칙들이 즉시 복원됩니다. 에이전트는 아무것도 잃지 않습니다—SOUL.md, USER.md, MEMORY.md는 모두 그대로 유지됩니다. 단지 그것들을 가리고 있던 대화를 지우는 것뿐입니다.
긴 작업을 짧은 세션으로 나누세요:
- 세션 1: "X를 연구하고 결과를 파일에 저장하세요" /new
- 세션 2: "저장한 파일을 읽고 요약을 초안 작성하세요" /new
- 세션 3: "이 요약을 검토하고 텔레그램으로 나에게 보내주세요"
각 세션은 SOUL.md가 완전히 로드된 상태로 새롭게 시작됩니다. 에이전트는 벗어나지 않습니다. 왜냐하면 세션이 벗어날 만큼 길어지지 않기 때문입니다.
벗어남을 완화하는 SOUL.md 서식 팁
가장 엄격한 규칙들을 파일의 시작이 아닌 끝부분으로 옮기세요. LLM은 프롬프트의 중간보다 끝부분에 더 많은 주의를 기울입니다. SOUL.md가 15줄이라면, 특히 세션이 길어질수록 모델은 1-4줄보다 12-15줄을 더 신뢰성 있게 따릅니다.
구조 예시:
# 나는 누구인가
당신은 [에이전트 이름]입니다. 당신은 [당신의 이름]을 돕습니다. 전문적이지만 캐주얼합니다. 나의 에너지에 맞추세요.
의사소통 방법
내가 세부 사항을 요청하지 않는 한 짧게 응답하세요. 질문에 먼저 답한 후, 필요할 때만 설명을 덧붙이세요.
엄격한 규칙 (절대 어기지 마세요)
절대 "absolutely", "great question", "certainly", "I'd be happy to."라고 말하지 마세요.
증거를 보여주지 않고 작업이 완료되었다고 말하지 마세요.
내 승인 없이 외부 자료를 보내지 마세요.
모르는 것이 있으면 모른다고 말하세요.
가장 끝에 강화 문구를 추가하세요:
모든 응답 전에, 위의 모든 규칙을 조용히 다시 읽고 적용하세요. 이것은 선택 사항이 아닙니다.
직접 테스트해 보세요: 새 세션을 시작하고, 메시지를 보내 규칙이 얼마나 잘 지켜지는지 확인하세요. 30개의 메시지 대화를 나누고, 에이전트가 길고 상세한 답변을 하도록 만든 후, 간단한 질문을 하세요—최근 대화 패턴이 주도권을 잡았기 때문에 또 다른 긴 답변이 나올 것입니다. /new를 입력하고 같은 질문을 하세요—SOUL.md가 아무것도 재정의하지 않은 상태로 돌아왔기 때문에 불필요한 말 없이 짧고 직접적인 응답을 받을 것입니다.
📖 전체 Source 읽기: r/openclaw
👀 See Also

ChatGPT 기록을 Claude의 메모리로 전송하는 네 가지 방법
Claude는 이제 ChatGPT 데이터를 위한 메모리 가져오기를 제공하지만, 속도, 제어, 보존 또는 이 세 가지를 결합한 하이브리드 방식 등 네 가지 접근법이 있으며 각각 다른 장단점이 있습니다.

OpenClaw 에이전트 일관성을 위한 반복 명상 시스템 구현
한 개발자가 OpenClaw 에이전트를 위한 구조화된 성찰 시스템을 공유합니다. 이 시스템은 meditations.md, reflections/*.md, 그리고 정체성 파일들을 포함하는 특정 파일 체인을 사용합니다. 매일 밤 반복되는 루틴은 이러한 파일들을 검토하고 내용을 추가하여, 지속 가능한 행동 변화에 대한 통찰력을 촉진합니다.

DeepSeek-V4-Flash W4A16+FP8과 MTP 자기추측: 2x RTX PRO 6000 Max-Q에서 85 tok/s
W4A16+FP8로 양자화된 DeepSeek-V4-Flash는 MTP 헤드가 개조된 패치 버전의 vLLM에서 2× RTX PRO 6000 Max-Q를 사용해 524k 컨텍스트에서 85.52 tok/s를 달성했으며, 이는 기준 52.85 tok/s에서 향상된 수치입니다.

Claude를 사용하여 쓰기 패턴을 분석하여 맞춤형 지침을 개선하기
레딧 사용자가 주관적인 어조 설명에 의존하기보다는 구두점 회피와 비유 출처와 같은 구체적인 패턴을 식별하기 위해 클로드가 10개의 글쓰기 샘플을 분석하도록 하는 방법을 통해 더 효과적인 맞춤 지침을 만드는 방법을 설명했습니다.