OpenClaw 응답 시간 개선 방법: 컨텍스트 비대화 줄이기

문제: 응답 속도 저하를 유발하는 무음 컨텍스트 잘림
Mac Mini M4에서 OpenClaw를 24/7로 실행 중인 개발자가 간단한 메시지에 대해 10분 응답 시간을 경험했습니다. 조사 결과 작업 공간 부트스트랩 파일 MEMORY.md가 26,421자(20,000자 제한 초과)였고 주입된 컨텍스트에서 무음으로 잘리고 있음이 밝혀졌습니다. 사용자 입력 전에 약 47,000자의 작업 공간 파일이 모든 메시지에 주입되고 있었으며, MEMORY.md 파일만 26,755자였습니다.
확인된 근본 원인
- MEMORY.md가 인덱스 역할을 하기보다는 전체 배포 명령, 재무 분석, 장황한 프로젝트 기록을 포함하고 있었음
- 표준 작업 공간 파일이 중복 콘텐츠로 비대해짐(AGENTS.md에는 시스템 프롬프트와 중복되는 지침이, TOOLS.md에는 이미 MEMORY.md에 있는 Telegram 그룹이 포함됨)
- 파일 크기에 대한 엄격한 제한이 없어 파일이 기본 bootstrapMaxChars 제한인 20,000자에 도달해 무음으로 잘릴 때까지 표류할 수 있었음
파일 구조 조정 결과
개발자는 MEMORY.md가 포인터만 포함해야 한다는 원칙을 사용하여 파일을 재구성했습니다. 정보가 필요할 때 프로젝트 파일에서 조회될 수 있다면 MEMORY.md에 속하지 않습니다.
- MEMORY.md: 26,755자에서 3,456자로 감소
- AGENTS.md: 8,436자에서 2,538자로 감소
- TOOLS.md: 4,468자에서 2,350자로 감소
- 총 주입 컨텍스트: 약 47,000자에서 약 16,000자로 감소
벤처 상태, Telegram ID, 자동화 및 인프라를 위한 비표준 파일(PROJECTS.md, LESSONS.md, VOICE.md)을 생성했습니다. 이러한 파일은 자동으로 주입되지 않지만 관련이 있을 때 memory_search를 통해 검색 가능합니다.
설정 변경
다음 설정을 ~/.openclaw/openclaw.json의 agents.defaults 아래에 추가하세요:
{
"bootstrapMaxChars": 8000,
"bootstrapTotalMaxChars": 40000,
"compaction": {
"mode": "safeguard",
"reserveTokensFloor": 20000,
"memoryFlush": {
"enabled": true,
"softThresholdTokens": 4000,
"systemPrompt": "세션이 압축에 가까워지고 있습니다. 지금 지속적인 메모리를 저장하세요.",
"prompt": "지속적인 메모를 memory/YYYY-MM-DD.md에 기록하세요; 저장할 내용이 없으면 NO_REPLY로 응답하세요."
}
},
"memorySearch": {
// 구성은 소스에서 계속됨
}
}
연구 통찰
개발자는 변경 사항을 구현하기 전에 여러 소스를 연구했습니다:
- OpenClaw 공식 문서: memory.md, agent-workspace.md, 압축 문서 및 컨텍스트 문서
- r/AI_Agents 게시물 "8 Ways OpenClaw Reduces Context Loss in Long-Running Agents": 통찰 "컨텍스트는 RAM과 같은 새로운 종류의 자원입니다."
- r/ClaudeAI 게시물 "How I solved context loss in long-running Claude agent sessions": reserveTokensFloor와 가벼운 conversation-state.md 세션 북마크 소개
- 에이전트 메모리 관리에 관한 Arxiv 논문 2602.11988v1: 컨텍스트 파일이 작업 성공률을 약 3% 감소시키고 추론 비용을 20%+ 증가시킨다는 발견
📖 전체 소스 읽기: r/clawdbot
👀 See Also

RTX 5090에서 AutoResearch 최적화: 실패한 점과 성공한 점
개발자가 RTX 5090/Blackwell 설정에서 AutoResearch를 실행하기 위한 구체적인 구성 세부 정보를 공유합니다. 여기에는 기능적으로 보이지만 성능이 저조했던 실패한 접근 방식과 TOTAL_BATCH_SIZE=2**17 및 TIME_BUDGET=1200으로 안정적인 결과를 달성한 작동 구성이 포함됩니다.

종단 간 LLM 스택 추적: 키 입력부터 스트리밍된 토큰까지
소프트웨어 엔지니어가 LLM에 프롬프트를 보낼 때 스택의 모든 계층에서 발생하는 일을 추적하는 포괄적인 문서를 작성했습니다. 클라이언트 측 토큰 카운팅, 네트워크 프로토콜, API 게이트웨이, 안전 분류기, 토큰화, KV 캐시, 샘플링 파이프라인, 스트리밍 메커니즘을 다룹니다.

Power Automate 및 FastMCP 서버를 통해 Claude에 M365 액세스 권한 부여
한 개발자가 Claude가 Power Automate 웹훅을 사용해 Microsoft 365(받은 편지함, 캘린더, OneDrive, Planner, Excel, Word)와 상호작용할 수 있는 경량 MCP 서버를 구축했습니다. 관리자 Graph 권한이 필요 없습니다.

캐머플록스 쿠키 인젝션: 당신의 에이전트가 작업하는 동안 당신 자신으로 레딧을 탐색하세요
Firefox 쿠키를 추출하여 Playwright를 통해 Camoufox에 주입하는 방법으로 Reddit 봇 탐지를 우회하는 상세한 가이드