OpenClaw 게이트웨이 신뢰성 문제: 25일간의 집중 사용 후 침묵하는 고장

게이트웨이 실패 패턴
OpenClaw 사용자가 약 25일 동안 18개 이상의 크론 작업과 Telegram 통합으로 시스템을 매일 운영하면서 반복되는 신뢰성 문제를 기록했습니다. 게이트웨이는 완전히 충돌하지는 않지만 '좀비화' 상태에 들어가 상태는 '실행 중'으로 표시되면서 모든 기능이 중단됩니다. 크론 작업은 무기한 멈추고, 메시지 전송이 실패하며, 건강 상태 모니터 크론 작업 자체를 포함한 어떤 경고도 생성되지 않습니다.
발견된 구체적인 문제
- 구성에서 잘못된 모델: 게이트웨이가 쓰기 시점에 잘못된 구성을 수락한 후 즉시 거부하지 않고 모든 에이전트 턴에서 조용히 실패했습니다.
- 세션 정지: 연결 오류로 인해 자동 복구나 알림 없이 15분 동안 서비스 중단이 발생했습니다.
- 세션 파일 잠금이 영구적으로 유지됨: 멈춘 도구 호출이 쓰기 잠금을 무기한 유지하여 모든 크론 작업을 차단합니다. 유일한 해결책은 완전한 재시작입니다.
- 부팅 시 게이트웨이가 시작되지 않음: macOS에서 LaunchAgent가 신뢰할 수 없어
@reboot sleep 30크론탭 해결책이 필요했습니다. - 재시작 시 크론 타이밍 재설정: 재시작 후 작업이 다시 실행되거나 시간대를 놓칩니다. 모델 별칭도 간헐적으로 깨집니다.
- 격리된 세션에서 크론 전송 실패: 메시지 도구가 격리된 세션에서 전송 권한이 없어 페이로드 재구성이 필요합니다.
- 주요 사고: 세션 쓰기 잠금이 4.3시간 동안 유지되면서 7개의 크론 작업이 유령 '실행' 상태에 갇혔습니다. 동시에 업데이트로 플러그인 경로와 모델 카탈로그 모듈이 깨졌습니다.
제안된 수정 사항
- 쓰기 잠금 타임아웃 (10분 후 강제 해제)
- 게이트웨이 자체 건강 상태 루프 (5분마다 모델 해결, 세션 쓰기, 채널 연결성 확인)
- 크론 멈춤 감지 (타임아웃의 2배 이상 '실행' 중인 작업 자동 재설정)
- 업데이트 안전 재시작 (npm 업데이트 시 정상적인 재시작 트리거)
openclaw cron reset <id>명령으로 전체 재시작 없이 작업 멈춤 해제
환경 세부 정보
macOS arm64, Node 22, 18개 크론 작업, Telegram 통합, LaunchAgent. 버전 2026.2.24 → 2026.2.25.
📖 전체 소스 읽기: r/openclaw
👀 See Also

OpenAI, GPT-5.3-Codex-Spark 연구용 미리보기 공개
OpenAI가 GPT-5.3-Codex-Spark를 연구 미리보기로 공개하며, 더 빠른 개발 능력을 약속했습니다.

GLM-5.1 출시, 코딩 성능 Claude Opus 4.5와 대등
Zhipu AI의 GLM-5.1 모델이 이제 모든 코딩 플랜 사용자에게 제공되며, SWE-bench-Verified에서 77.8점, Terminal Bench 2.0에서 56.2점을 달성했습니다. 이 모델은 200K 컨텍스트 윈도우, 128K 최대 출력, 744B 파라미터(40B 활성화)를 특징으로 합니다.

Delve는 Sim.ai의 오픈소스 SimStudio를 포크하여 Pathways로 판매한 혐의를 받고 있습니다.
컴플라이언스 스타트업 델브(Delve)가 Sim.ai의 오픈소스 에이전트 구축 도구 SimStudio를 포크하여 Pathways로 재브랜딩한 후, Sim.ai와의 적절한 라이선스 표시나 금전적 합의 없이 판매한 혐의를 받고 있으며, 이는 아파치 라이선스 조건을 위반할 가능성이 있습니다.

클로드 코드 엔지니어 업데이트: 사용자 질문 요청 마크다운, HTTP 훅, 새로운 스킬
클로드 코드 엔지니어가 세 가지 업데이트를 발표했습니다: AskUserQuestion 도구가 이제 다이어그램과 코드 예제를 위한 마크다운 스니펫을 지원하고, 새로운 HTTP 훅 핸들러가 훅이 HTTP 엔드포인트에 데이터를 게시할 수 있도록 하며, 두 가지 새로운 스킬이 추가되었습니다.