OpenClaw LLM 콜드 모델 로딩 타임아웃 수정

문제: 차가운 모델이 60초에 타임아웃
사용자들은 OpenClaw에서 차갑게 로드된 로컬 모델이 일반 에이전트 타임아웃이 훨씬 더 높게 설정되어 있음에도 불구하고 약 60초 후에 지속적으로 실패한다고 보고했습니다. 이 문제는 Ollama를 통한 클라우드 모델과 때로는 OpenAI Codex에서도 발생했습니다.
일반적인 실패 패턴:
- 이미 예열된 모델은 작동함
- 차가운 모델은 약 60초 후에 중단됨
- 로그에 타임아웃 / embedded 장애 조치 / 상태: 408이 언급됨
- 대체 모델이 인수함
오해의 소지가 있는 구성
출처는 몇 가지 명백한 구성 옵션이 실제 해결책이 아니며 개발자를 잘못된 길로 이끌 수 있다고 경고합니다:
agents.defaults.timeoutSeconds.zshrc내보내기LLM_REQUEST_TIMEOUT- 즉시 LM Studio / Ollama 탓하기
근본 원인
이 문제는 OpenClaw가 모델이 첫 번째 스트리밍 토큰을 내보내기 전 기간에 대한 별도의 embedded-runner LLM 유휴 타임아웃을 가지고 있기 때문에 발생합니다.
소스 추적 위치:
src/agents/pi-embedded-runner/run/llm-idle-timeout.ts
기본값:
DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000
구성 경로는 다음에서 확인됩니다:
cfg?.agents?.defaults?.llm?.idleTimeoutSeconds
따라서 실제 구성 매개변수는 다음과 같습니다:
agents.defaults.llm.idleTimeoutSeconds
해결 방법
테스트 후, 작동하는 구성은 다음과 같습니다:
{
"agents": {
"defaults": {
"llm": {
"idleTimeoutSeconds": 180
}
}
}
}
테스트 결과, 이전에 약 60초에 실패했던 차가운 Gemma 호출이 해당 임계값을 넘어서 생존했으며 결국 즉각적인 장애 조치 없이 성공적으로 응답했습니다.
권장 영구 구성
{
"agents": {
"defaults": {
"timeoutSeconds": 300,
"llm": {
"idleTimeoutSeconds": 300
}
}
}
}
300초 권장 사항은 로컬 모델이 예측 불가능한 경우를 고려한 것으로, 잘못된 장애 조치가 진정으로 차가운 모델을 더 오래 기다리는 것보다 더 문제가 됩니다.
📖 전체 소스 읽기: r/openclaw
👀 See Also

클로드 코드에서 훅을 사용하여 클로드의 시간 환각 문제 해결하기
한 사용자가 Claude Code가 실시간 시계 접근 권한이 없어 부적절한 시간에 '좀 쉬세요'와 같은 조언을 잘못 제시하는 문제를 발견했습니다. 해결책은 ~/.claude/settings.json에 한 줄의 훅을 추가하여 모든 메시지에 현재 시간을 Claude의 컨텍스트에 주입하는 것입니다.

OpenClaw 예약/크론잡 작업이 실패하는 이유
OpenClaw에서 에이전트에게 예약 작업을 요청하면 종종 OpenClaw의 프롬프트-인-크론 기능 대신 셸 또는 파이썬 스크립트를 생성합니다. 이로 인해 작업이 비에이전트 방식이 되어 비효율적입니다.

클로드의 일반적인 불편함을 방지하기 위한 필수 맞춤 지침
레딧 사용자가 Claude의 일반적인 불편함을 해결하기 위해 세 가지 구체적인 사용자 지정 지침을 공유했습니다: 파괴적인 명령 전에 경고 요구, 답변 중간 계획 변경 방지, 코드 블록을 기능적 코드 전용으로 유지.

7 MCP 게이트웨이 버그: 세션 누수, 중단된 SSE, 게이트웨이 모드의 OAuth
Reddit 게시물 하나가 실제 MCP 게이트웨이 버그 7가지를 자세히 설명합니다 — 클라이언트 간 세션 상태 누출, 조용한 SSE 연결 끊김, 게이트웨이 모드에서의 OAuth 실패 등 — 더 나은 프롬프트가 아닌 지루한 인프라를 기반으로 한 수정 사항과 함께.