OpenClaw가 생산성 플레이북의 수상한 스크립트를 차단한 후 재무 워크북 구축을 계속했습니다

한 Reddit 사용자가 r/openclaw에 OpenClaw가 가족 대화 전에 재정 정리를 도와준 이야기를 공유했습니다. 그 과정에서 의심스러운 스크립트도 차단했습니다.
상황
사용자는 여러 긴급한 작업을 안고 있었습니다: 자신의 전화번호와 연결된 낯선 은행 계좌, 아내의 의료 기록과 재정 서류 요청, 그리고 압도당하는 느낌. 사용자는 OpenClaw에게 개인 메모, 사양 문서, 그리고 온라인에서 찾은 "생산성 플레이북"이라는 PDF가 포함된 zip 파일을 제공했습니다. 플레이북은 연락처와 재정의 관계 지도를 자동 생성한다고 주장하며, 사용자에게 로컬 도구 폴더에 넣고 실행하라는 파이썬 스크립트를 포함하고 있었습니다.
스크립트 자동 차단
OpenClaw는 플레이북과 스크립트를 읽은 후, 스크립트가 로컬 스킬 디렉토리에 자신을 복사하고 pip 패키지를 자동 설치하려는 것을 식별하고 실행을 거부했습니다. 사용자에 따르면, OpenClaw는 다음과 같이 출력했습니다: 이 스크립트는 로컬 스킬 디렉토리에 자신을 복사하고 확인되지 않은 의존성을 설치하려고 시도하므로, 실행하지 않겠습니다
. 완전히 멈추는 대신, OpenClaw는 내장 스킬을 사용해 수동으로 워크북을 계속 구축했습니다.
재정 교차 검증
사용자는 기억에 의존해 계좌 잔액을 적었지만, 많은 부분이 틀렸습니다 — 저축액은 생각의 절반이었고, 신용 카드 잔액은 기억보다 높았습니다. OpenClaw는 Fintrack(연결된 금융 도구)에서 실제 숫자를 가져와 사용자의 메모를 맹목적으로 사용하는 대신 모든 불일치를 지적했습니다.
어려움을 겪은 부분
OpenClaw는 프라이버시에 관한 더 섬세한 판단에 어려움을 겪었습니다. 사용자가 아내와 공유할 준비가 되지 않은 개인 정보까지 워크북에 모두 포함시켰습니다. 사용자는 가족이 볼 수 있는 항목을 수동으로 정리해야 했습니다. 또한, OpenClaw는 거래 내역이 없는 사용자 메모의 구독 항목을 포함시켰는데, 사용자는 이를 확인되지 않은 항목으로 표시하길 원했습니다.
핵심 교훈
스크립트 차단 기능은 사용자가 악성 코드를 실행하는 것을 막았을 가능성이 높습니다. OpenClaw의 거부는 완전한 중단이 아니라 신뢰할 수 있는 스킬을 사용해 수동 작업으로 우아하게 전환한 것입니다. AI 코딩 에이전트를 사용하는 개발자에게 이는 실용적인 샌드박싱과 투명한 거부 메시지의 가치를 보여줍니다.
📖 전체 출처 읽기: r/openclaw
👀 See Also

클로드 챗봇이 멕시코 정부 데이터 유출 사건에서 악용됐다
해커가 Anthropic의 Claude 챗봇을 이용해 멕시코 정부 기관 여러 곳을 공격하여 납세자 기록과 직원 인증 정보를 포함한 150GB의 데이터를 훔쳤습니다. 해커는 프롬프트를 사용해 Claude의 보호 장치를 우회하고 수천 건의 상세한 공격 계획을 생성했습니다.

llm-hasher: 하이브리드 LLM 워크플로우를 위한 로컬 PII 탐지 및 토큰화
llm-hasher는 OpenAI나 Claude와 같은 외부 LLM에 데이터가 전달되기 전에 Ollama를 사용해 개인 식별 정보를 로컬에서 탐지하고, PII를 토큰화한 후 처리 완료 시 원본을 복원하는 도구입니다. 정규식을 사용해 구조화된 데이터 유형을 탐지하고, 로컬 LLM을 사용해 문맥 기반 탐지를 수행하며, 매핑 정보는 암호화된 저장소에 보관합니다.

jqwik v1.10.0, AI 에이전트가 사용할 때 코드를 삭제하는 프롬프트 인젝션을 몰래 주입하다
Johannes Link가 JUnit 5용 jqwik 테스트 엔진의 v1.10.0에 AI 코딩 에이전트를 대상으로 한 숨겨진 프롬프트 인젝션을 추가했습니다. 이 명령은 ANSI 이스케이프로 숨겨져 있으며, AI 에이전트에게 모든 jqwik 테스트와 코드를 삭제하도록 지시합니다. Claude는 이를 정확히 식별했지만, 인간 사용자는 쉽게 알아차리지 못할 수 있습니다.

Tailscale을 이용한 OpenClaw의 안전한 원격 접속
없음