OpenClaw 설정: Docker, Chromium, noVNC를 활용한 인간 참여형 브라우저 자동화

r/openclaw의 한 개발자가 자동화된 브라우저 세션 중 CAPTCHA 해결 및 승인과 같은 인간 개입이 필요한 작업을 OpenClaw가 처리할 수 있도록 한 설정을 문서화했습니다. 이 솔루션은 필요할 때 원격 개입을 허용하기 위해 Chromium, noVNC 및 관련 도구가 포함된 Docker 컨테이너를 사용합니다.
작동 방식
에이전트는 Chrome DevTools Protocol(CDP)을 통해 헤드리스 브라우저를 구동합니다. CAPTCHA를 만나거나 인간 승인이 필요할 때 Telegram 알림을 보냅니다. 사용자는 휴대폰이나 노트북에서 noVNC URL을 열어 브라우저를 보고 상호작용한 후 "완료"라고 답장하여 에이전트가 계속 진행하도록 합니다. 이 설정은 약 300MB의 RAM과 3초의 콜드 스타트 시간이 필요합니다.
실제 적용 사례
개발자는 이 설정을 OpenClaw가 택배 픽업을 예약하도록 하여 테스트했습니다. 운송장과 이메일 사진을 제공한 후, 에이전트는 온라인 양식을 작성하고 날짜를 선택하여 제출하는 동안 개발자는 noVNC를 통해 모니터링했습니다. Claude Opus 4.6의 Chromium 위젯은 동일한 작업에서 네비게이션 루프에 갇히는 반면 OpenClaw는 예약을 완료했다고 언급했습니다.
기술적 구현
Docker 컨테이너는 다음을 실행합니다:
- 가상 디스플레이를 위한 Xvfb
- Playwright가 포함된 Chromium
- 원격 보기를 위한 x11vnc 및 noVNC
- 프로세스 관리를 위한 supervisord
봇은 컨테이너 내부에서 CDP를 통해 Chromium을 제어하는 반면, 사용자는 간단한 URL(앱 불필요)로 모든 기기에서 noVNC를 통해 브라우저를 볼 수 있습니다.
보안 조치
- noVNC는 Tailscale을 통해서만 접근 가능(클라이언트 기기가 tailnet에 포함되어야 함)
- CDP 포트는 localhost에만 바인딩
- 컨테이너는 호스트 파일 시스템에 접근 불가
- Chromium은 비특권으로 실행
- 비밀번호/2FA는 noVNC 클립보드 패널을 통해 직접 처리
추가 강화
- Docker 헬스체크: 30초마다 CDP 폴링, 비정상 상태 전에 3회 재시도
- 리소스 제한: 1GB RAM + 2 CPU
- 탭 정리기: 최대 5개 탭 유지, 빈 탭 닫기, 5분마다 실행
- 컨테이너는 호스트 마운트 없이 격리 상태 유지
Docker 구성
Dockerfile은 Ubuntu 24.04를 사용하고 다음을 설치합니다:
FROM ubuntu:24.04
ENV DEBIAN_FRONTEND=noninteractive
ENV DISPLAY=:99
ENV RESOLUTION=1920x1080x24
RUN apt-get update && apt-get install -y --no-install-recommends \
ca-certificates xvfb x11vnc fonts-liberation \
dbus-x11 supervisor curl gnupg websockify novnc \
&& rm -rf /var/lib/apt/lists/*
RUN curl -fsSL https://deb.nodesource.com/setup_20.x | bash - \
&& apt-get install -y nodejs \
&& npx playwright install --with-deps chromium \
&& rm -rf /var/lib/apt/lists/*
RUN useradd -m -s /bin/bash browser \
&& mkdir -p /home/browser/.cache \
&& cp -r /root/.cache/ms-playwright /home/browser/.cache/ \
&& chown -R browser:browser /home/browser
COPY supervisord.conf /etc/supervisor/conf.d/supervisord.conf
COPY start-chromium.sh /usr/local/bin/start-chromium.sh
RUN chmod +x /usr/local/bin/start-chromium.sh
RUN ln -sf /usr/share/novnc/vnc.html /usr/share/novnc/index.html
EXPOSE 6080 9222
CMD ["/usr/bin/supervisord", "-c", "/etc/supervisor/conf.d/supervisord.conf"]
supervisord.conf는 네 가지 프로세스(Xvfb, Chromium, x11vnc, noVNC/websockify)를 관리합니다.
start-chromium.sh 스크립트는 CDP 접근을 위해 --remote-debugging-port=9222 --remote-debugging-address=0.0.0.0을 포함한 특정 플래그로 Chrome을 실행합니다.
할 일 항목
개발자는 noVNC에 토큰 인증을 추가하고 유휴 시간 초과 후 자동 중지 기능을 구현할 계획입니다.
📖 전체 소스 읽기: r/openclaw
👀 See Also

12가지 오픈클로 SOUL.md 및 STYLE.md 템플릿과 실용적인 레슨
한 개발자가 일반적인 사용 사례에 맞춘 12개의 OpenClaw 에이전트 템플릿을 만들었습니다. 각 템플릿은 공식 4섹션 사양을 따르며, 핵심 교훈으로는 의사소통 패턴을 정의하는 STYLE.md의 필요성과 모호한 성격 특성보다 구체적인 경계 설정의 중요성이 포함됩니다.

Claude 코드 프로젝트를 CLAUDE.md, Skills, MCP로 구조화하기
한 개발자가 Claude Code에 대한 워크플로우 개선 방법을 공유했습니다. 계획 모드로 시작하기, 프로젝트 메모리를 위한 CLAUDE.md 파일 유지, 반복 작업에 재사용 가능한 스킬 생성, 외부 도구 연결을 위한 MCP 사용 등이 포함됩니다.

안정적인 설정을 위한 세 가지 필수 OpenClaw 기술: 메모리, 보안, 탐색
레딧 게시물에서는 세 가지 특정 유형의 OpenClaw 스킬을 먼저 설치할 것을 권장합니다: 컨텍스트 손실을 방지하는 메모리 수정 스킬, 악성 코드를 확인하는 로컬 보안 검증 스킬, 그리고 유지 관리되는 도구를 찾기 위한 큐레이션된 발견 허브입니다.

1000시간의 경험에서 얻은 실용적인 AI 코딩 전략
레딧 게시물은 AI 코딩 에이전트를 효과적으로 사용하기 위한 구체적인 프롬프팅 수준과 워크플로우 전략을 설명하며, AI를 주니어 개발자처럼 대우하고, 단계적 구현, 지시 파일 사용 등을 포함합니다.