OpenClaw 응답 시간 개선: 컨텍스트 크기 66% 감소

문제: 응답 속도 저하를 유발하는 무음 컨텍스트 잘림

Mac Mini M4에서 OpenClaw를 24/7로 실행 중인 개발자가 간단한 메시지에 대해 10분 응답 시간을 경험했습니다. 조사 결과 작업 공간 부트스트랩 파일 MEMORY.md가 26,421자(20,000자 제한 초과)였고 주입된 컨텍스트에서 무음으로 잘리고 있음이 밝혀졌습니다. 사용자 입력 전에 약 47,000자의 작업 공간 파일이 모든 메시지에 주입되고 있었으며, MEMORY.md 파일만 26,755자였습니다.

확인된 근본 원인

MEMORY.md가 인덱스 역할을 하기보다는 전체 배포 명령, 재무 분석, 장황한 프로젝트 기록을 포함하고 있었음
표준 작업 공간 파일이 중복 콘텐츠로 비대해짐(AGENTS.md에는 시스템 프롬프트와 중복되는 지침이, TOOLS.md에는 이미 MEMORY.md에 있는 Telegram 그룹이 포함됨)
파일 크기에 대한 엄격한 제한이 없어 파일이 기본 bootstrapMaxChars 제한인 20,000자에 도달해 무음으로 잘릴 때까지 표류할 수 있었음

파일 구조 조정 결과

개발자는 MEMORY.md가 포인터만 포함해야 한다는 원칙을 사용하여 파일을 재구성했습니다. 정보가 필요할 때 프로젝트 파일에서 조회될 수 있다면 MEMORY.md에 속하지 않습니다.

MEMORY.md: 26,755자에서 3,456자로 감소
AGENTS.md: 8,436자에서 2,538자로 감소
TOOLS.md: 4,468자에서 2,350자로 감소
총 주입 컨텍스트: 약 47,000자에서 약 16,000자로 감소

벤처 상태, Telegram ID, 자동화 및 인프라를 위한 비표준 파일(PROJECTS.md, LESSONS.md, VOICE.md)을 생성했습니다. 이러한 파일은 자동으로 주입되지 않지만 관련이 있을 때 memory_search를 통해 검색 가능합니다.

설정 변경

다음 설정을 ~/.openclaw/openclaw.json의 agents.defaults 아래에 추가하세요:

{
  "bootstrapMaxChars": 8000,
  "bootstrapTotalMaxChars": 40000,
  "compaction": {
    "mode": "safeguard",
    "reserveTokensFloor": 20000,
    "memoryFlush": {
      "enabled": true,
      "softThresholdTokens": 4000,
      "systemPrompt": "세션이 압축에 가까워지고 있습니다. 지금 지속적인 메모리를 저장하세요.",
      "prompt": "지속적인 메모를 memory/YYYY-MM-DD.md에 기록하세요; 저장할 내용이 없으면 NO_REPLY로 응답하세요."
    }
  },
  "memorySearch": {
    // 구성은 소스에서 계속됨
  }
}

연구 통찰

개발자는 변경 사항을 구현하기 전에 여러 소스를 연구했습니다:

OpenClaw 공식 문서: memory.md, agent-workspace.md, 압축 문서 및 컨텍스트 문서
r/AI_Agents 게시물 "8 Ways OpenClaw Reduces Context Loss in Long-Running Agents": 통찰 "컨텍스트는 RAM과 같은 새로운 종류의 자원입니다."
r/ClaudeAI 게시물 "How I solved context loss in long-running Claude agent sessions": reserveTokensFloor와 가벼운 conversation-state.md 세션 북마크 소개
에이전트 메모리 관리에 관한 Arxiv 논문 2602.11988v1: 컨텍스트 파일이 작업 성공률을 약 3% 감소시키고 추론 비용을 20%+ 증가시킨다는 발견

📖 전체 소스 읽기: r/clawdbot