OpenClaw LLM 콜드 모드 타임아웃 수정 방법

문제: 차가운 모델이 60초에 타임아웃

사용자들은 OpenClaw에서 차갑게 로드된 로컬 모델이 일반 에이전트 타임아웃이 훨씬 더 높게 설정되어 있음에도 불구하고 약 60초 후에 지속적으로 실패한다고 보고했습니다. 이 문제는 Ollama를 통한 클라우드 모델과 때로는 OpenAI Codex에서도 발생했습니다.

일반적인 실패 패턴:

이미 예열된 모델은 작동함
차가운 모델은 약 60초 후에 중단됨
로그에 타임아웃 / embedded 장애 조치 / 상태: 408이 언급됨
대체 모델이 인수함

오해의 소지가 있는 구성

출처는 몇 가지 명백한 구성 옵션이 실제 해결책이 아니며 개발자를 잘못된 길로 이끌 수 있다고 경고합니다:

agents.defaults.timeoutSeconds
.zshrc 내보내기
LLM_REQUEST_TIMEOUT
즉시 LM Studio / Ollama 탓하기

근본 원인

이 문제는 OpenClaw가 모델이 첫 번째 스트리밍 토큰을 내보내기 전 기간에 대한 별도의 embedded-runner LLM 유휴 타임아웃을 가지고 있기 때문에 발생합니다.

소스 추적 위치:

src/agents/pi-embedded-runner/run/llm-idle-timeout.ts

기본값:

DEFAULT_LLM_IDLE_TIMEOUT_MS = 60_000

구성 경로는 다음에서 확인됩니다:

cfg?.agents?.defaults?.llm?.idleTimeoutSeconds

따라서 실제 구성 매개변수는 다음과 같습니다:

agents.defaults.llm.idleTimeoutSeconds

해결 방법

테스트 후, 작동하는 구성은 다음과 같습니다:

{
  "agents": {
    "defaults": {
      "llm": {
        "idleTimeoutSeconds": 180
      }
    }
  }
}

테스트 결과, 이전에 약 60초에 실패했던 차가운 Gemma 호출이 해당 임계값을 넘어서 생존했으며 결국 즉각적인 장애 조치 없이 성공적으로 응답했습니다.

권장 영구 구성

{
  "agents": {
    "defaults": {
      "timeoutSeconds": 300,
      "llm": {
        "idleTimeoutSeconds": 300
      }
    }
  }
}

300초 권장 사항은 로컬 모델이 예측 불가능한 경우를 고려한 것으로, 잘못된 장애 조치가 진정으로 차가운 모델을 더 오래 기다리는 것보다 더 문제가 됩니다.

📖 전체 소스 읽기: r/openclaw

OpenClaw LLM 콜드 모델 로딩 타임아웃 수정

문제: 차가운 모델이 60초에 타임아웃

오해의 소지가 있는 구성

근본 원인

해결 방법

권장 영구 구성

👀 See Also

클로드 코드 토큰 감사 결과, 기본 도구 로딩으로 인한 숨겨진 비용이 드러났습니다.

클로드 코드가 안전한 프로덕션 데이터베이스 코드를 작성하게 만든 4가지 파일

대규모 OpenClaw 프로젝트에서 메모리 관리를 위한 프로젝트 내러티브 활용

워크플로우 메모리가 도구보다 중요한 이유: 컨텍스트 로딩이 거대한 프롬프트를 이기는 이유