OpenClaw + Ollama 로컬 모델 타임아웃 디버깅: 침묵하는 실패를 해결하는 다섯 가지 방법

문제: 로컬 Ollama 모델에서 OpenClaw 에이전트가 자동으로 실패함
개발자가 M4 Max Mac Studio에서 Ollama 0.20.2와 Gemma 4 26B-A4B Q8_0 모델을 사용하여 OpenClaw 2026.4.2를 디버깅하는 동안, ollama run을 통해 모델이 즉시 작동함에도 불구하고 /new 명령 후 에이전트가 응답하지 않는 문제를 발견했습니다. 로그에는 오류가 나타나지 않았으며, 에이전트는 타이핑 표시기를 보여주지 않았습니다.
근본 원인 및 해결 방법
- 근본 원인 #1: 슬러그 생성기 블로킹: OpenClaw의
session-memory훅은 15초 고정 타임아웃으로 Ollama에 요청을 보내는 슬러그 생성기를 실행합니다. 모델이 OpenClaw의 시스템 프롬프트를 제시간에 처리하지 못하면, OpenClaw는 요청을 포기하지만 Ollama는 계속 처리하여 후속 에이전트 요청을 차단합니다.
해결 방법:openclaw hooks disable session-memory - 근본 원인 #2: 큰 시스템 프롬프트: OpenClaw는 요청당 약 38,500자의 시스템 프롬프트(신원, 도구, 부트스트랩 파일)를 주입합니다. 로컬 모델은 프리필 단계에 40-60초가 필요합니다.
해결 방법: 부트스트랩 주입을 건너뛰고 문자 수를 제한하도록 설정에 추가:
이렇게 하면 프롬프트가 ~19K 문자로 줄어듭니다.{ "agents": { "defaults": { "skipBootstrap": true, "bootstrapTotalMaxChars": 500 } } } - 근본 원인 #3: 숨겨진 유휴 타임아웃: OpenClaw는
DEFAULT_LLM_IDLE_TIMEOUT_MS를 60초로 설정합니다. 모델이 이 시간 내에 첫 번째 토큰을 생성하지 않으면 연결을 종료하고 대체 모델(예: Claude Sonnet)로 자동 전환됩니다.
해결 방법: 문서화되지 않은 설정 키를 설정:{ "agents": { "defaults": { "llm": { "idleTimeoutSeconds": 300 } } } } - 근본 원인 #4: Ollama 직렬 처리: Ollama는 요청을 직렬로 처리하므로, 포기된 슬러그 생성기 요청이 처리 슬롯을 점유할 수 있습니다.
해결 방법: Ollama plist/서비스 설정에 추가:OLLAMA_NUM_PARALLEL=4 - 근본 원인 #5: 사고 모드 지연: Gemma 4는 기본적으로 첫 번째 토큰 전에 20-30초를 추가하는 사고/추론 단계를 사용합니다.
해결 방법: 설정에서 비활성화:{ "agents": { "defaults": { "thinkingDefault": "off" } } }
완전한 작동 구성
개발자가 작동하는 설정을 위한 완전한 구성을 제공했습니다:
{ "agents": { "defaults": { "model": { "primary": "ollama/gemma4:26b-a4b-it-q8_0", "fallbacks": ["anthropic/claude-sonnet-4-6"] }, "thinkingDefault": "off", "timeoutSeconds": 600, "skipBootstrap": true, "bootstrapTotalMaxChars": 500, "llm": { "idleTimeoutSeconds": 300 } } } }또한, 요청 간 언로딩을 방지하기 위해 모델을 메모리에 고정하세요:
curl http://localhost:11434/api/generate -d '{"model":"gemma4:26b-a4b-it-q8_0","keep_alive":-1,"options":{"num_ctx":16384}}'결과 및 절충점
해결 방법을 적용한 후, /new 후 첫 번째 메시지는 시스템 프롬프트 프리필로 인해 약 60초가 소요되며, 이는 로컬 모델에 불가피한 것으로 설명됩니다. 후속 메시지는 Ollama가 KV 상태를 캐시하기 때문에 빠릅니다. 이 설정은 31GB VRAM, 100% GPU, 16K 컨텍스트 창을 사용하며, 완전히 로컬에서 실행되어 API 비용이 전혀 들지 않습니다.
초기 지연은 완전한 로컬 운영, 개인 정보 보호, 비용 없음을 위한 절충점입니다. 개발자는 이러한 요소가 우선순위라면 이 방법이 가치 있다고 언급했습니다.
📖 전체 소스 읽기: r/LocalLLaMA
👀 See Also

클로드 코워크를 위한 커스텀 스킬 제작: 모범 사례와 형식
Claude Co-Work의 새로운 기능과 최근 스킬 업데이트를 통해 개발자들은 플랫폼 내 워크플로우를 향상시키기 위한 맞춤형 스킬 제작을 탐색하기 시작했습니다. 한 사용자는 Claude Co-Work를 효과적으로 활용하기 위한 여정을 공유하며, 새로운 스킬을 작업 환경에 통합하는 데 필요한 올바른 파일 형식과 배포 전략을 이해하는 것의 중요성을 강조했습니다.

인지적 과정을 자동화하기 위한 Claude 스킬 구축
클로드 코드에는 코드를 작성하는 대신 자연어로 프로세스를 설명하여 AI 기반 스킬을 구축할 수 있는 내장 스킬 크리에이터가 포함되어 있습니다. 출처에 따르면, 스타트업 검증 스킬을 만들어 2일 동안 수동으로 진행하던 프로세스를 15분으로 단축했습니다.

레딧 사용자의 Claude Code 폴더 구조 치트 시트
레딧 사용자가 클로드 코드의 폴더 구조에 대한 치트 시트를 만들었습니다. 이는 일반적인 문제점들을 겪은 후 작성된 것으로, .claude/ 디렉토리 레이아웃, 훅 이벤트, settings.json, MCP 설정, 스킬 구조, 컨텍스트 관리 임계값 등을 다룹니다.

Claude 코드 프로젝트를 CLAUDE.md, Skills, MCP로 구조화하기
한 개발자가 Claude Code에 대한 워크플로우 개선 방법을 공유했습니다. 계획 모드로 시작하기, 프로젝트 메모리를 위한 CLAUDE.md 파일 유지, 반복 작업에 재사용 가능한 스킬 생성, 외부 도구 연결을 위한 MCP 사용 등이 포함됩니다.