AI 에이전트 세션 표류 해결: SOUL.md 규칙 유지 방법

SOUL.md 규칙이 처음 10-15개의 메시지에서는 완벽하게 작동하지만, 세션 후반에 무시된다면 시스템이 고장난 것이 아니라 세션이 규칙을 초월한 것입니다. 이는 SOUL.md가 세션 시작 시 시스템 프롬프트의 일부로 한 번 로드되지만, 대화 컨텍스트가 증가함에 따라(20번째 메시지쯤에는 수천 개의 토큰) 모델이 초기 프롬프트보다 최근 메시지 패턴에 더 많은 주의를 기울이기 때문입니다.

긴 세션에서 SOUL.md 규칙이 벗어나는 이유

첫 번째 메시지에서는 SOUL.md가 가장 큰 영향력을 발휘합니다. 모델은 이를 주의 깊게 읽고 따릅니다. "절대 'absolutely'라고 말하지 마세요", "나의 어조에 맞추세요", "직설적으로, 불필요한 말은 하지 마세요"와 같은 규칙들이 완벽하게 작동합니다. 20-30번째 메시지가 되면 에이전트는 점차 벗어나기 시작합니다—"absolutely"가 다시 스며들고, 응답이 길어지며, 불필요한 말이 돌아옵니다. SOUL.md는 기술적으로 여전히 존재하지만, 이후에 발생한 모든 것에 의해 가려집니다.

첫 날에 주어진 직무 설명서를 생각해 보세요. 3주가 지나면 직원은 매일 아침 그것을 다시 읽지 않습니다—그들은 최근 패턴을 바탕으로 옳다고 느껴지는 일을 합니다. 지난 10번의 대화가 길고 상세했다면, 에이전트는 SOUL.md가 "간결하게"라고 지시했더라도 길고 상세한 방식으로 기본 응답합니다.

주요 해결책: /new를 적극적으로 사용하세요

이것은 문제의 80%를 해결하며 비용이 들지 않습니다. 대부분의 사람들은 /new를 상황이 망가졌을 때의 최후의 수단으로 여깁니다. 대신, 각각의 다른 작업 전에 지속적으로 사용하세요:

연구? /new
캐주얼 채팅으로 돌아가기? /new
이메일 초안 작성이 필요? /new

에이전트의 어조가 벗어나기 시작할 때마다, /new를 입력하면 규칙들이 즉시 복원됩니다. 에이전트는 아무것도 잃지 않습니다—SOUL.md, USER.md, MEMORY.md는 모두 그대로 유지됩니다. 단지 그것들을 가리고 있던 대화를 지우는 것뿐입니다.

긴 작업을 짧은 세션으로 나누세요:

세션 1: "X를 연구하고 결과를 파일에 저장하세요" /new
세션 2: "저장한 파일을 읽고 요약을 초안 작성하세요" /new
세션 3: "이 요약을 검토하고 텔레그램으로 나에게 보내주세요"

각 세션은 SOUL.md가 완전히 로드된 상태로 새롭게 시작됩니다. 에이전트는 벗어나지 않습니다. 왜냐하면 세션이 벗어날 만큼 길어지지 않기 때문입니다.

벗어남을 완화하는 SOUL.md 서식 팁

가장 엄격한 규칙들을 파일의 시작이 아닌 끝부분으로 옮기세요. LLM은 프롬프트의 중간보다 끝부분에 더 많은 주의를 기울입니다. SOUL.md가 15줄이라면, 특히 세션이 길어질수록 모델은 1-4줄보다 12-15줄을 더 신뢰성 있게 따릅니다.

구조 예시:

# 나는 누구인가 당신은 [에이전트 이름]입니다. 당신은 [당신의 이름]을 돕습니다. 전문적이지만 캐주얼합니다. 나의 에너지에 맞추세요. 의사소통 방법 내가 세부 사항을 요청하지 않는 한 짧게 응답하세요. 질문에 먼저 답한 후, 필요할 때만 설명을 덧붙이세요. 엄격한 규칙 (절대 어기지 마세요)

절대 "absolutely", "great question", "certainly", "I'd be happy to."라고 말하지 마세요. 증거를 보여주지 않고 작업이 완료되었다고 말하지 마세요. 내 승인 없이 외부 자료를 보내지 마세요. 모르는 것이 있으면 모른다고 말하세요.

가장 끝에 강화 문구를 추가하세요:

모든 응답 전에, 위의 모든 규칙을 조용히 다시 읽고 적용하세요. 이것은 선택 사항이 아닙니다.

직접 테스트해 보세요: 새 세션을 시작하고, 메시지를 보내 규칙이 얼마나 잘 지켜지는지 확인하세요. 30개의 메시지 대화를 나누고, 에이전트가 길고 상세한 답변을 하도록 만든 후, 간단한 질문을 하세요—최근 대화 패턴이 주도권을 잡았기 때문에 또 다른 긴 답변이 나올 것입니다. /new를 입력하고 같은 질문을 하세요—SOUL.md가 아무것도 재정의하지 않은 상태로 돌아왔기 때문에 불필요한 말 없이 짧고 직접적인 응답을 받을 것입니다.

📖 전체 Source 읽기: r/openclaw