KnightClaw: OpenClaw 에이전트를 위한 로컬 보안 확장

KnightClaw은 적대적 프롬프트로부터 OpenClaw AI 코딩 에이전트를 보호하도록 설계된 보안 확장 프로그램입니다. 이 도구는 컨텍스트 창에 단일 악성 메시지가 에이전트가 사용자 명령 대신 공격자 지시를 따르도록 할 수 있는 특정 위협 모델을 해결합니다.
핵심 기능
KnightClaw은 구성이 필요 없고 API 키나 클라우드 의존성이 없는 드롭인 확장 프로그램으로 작동합니다. 에이전트에 도달하기 전에 모든 메시지를 가로챕니다.
탐지 시스템
이 가드는 8계층 하이브리드 탐지 접근 방식을 사용합니다:
- 정규식 패턴
- 호모글리프 탐지
- 경계 토큰 분석
- 퍼플렉서티 점수화
- 엔트로피 분석
- 휴리스틱
- 의미 임베딩 (로컬, 양자화된 BGE 모델 사용)
차단은 마이크로초 단위로 발생합니다.
추가 보안 조치
- 이그레스 리댁션: 에이전트를 떠나기 전에 아웃바운드 응답에서 비밀을 제거합니다
- 해시 체인 감사 로그: 모든 차단, 허용 및 구성 변경의 전체 타임라인을 포함하는 변조 방지, 추가 전용 로그
- 속도 회로 차단기: 60초 내 10회 차단 시 수동 개입 없이 자동 잠금이 트리거됩니다
- 킬 스위치: 하나의 명령으로 모든 것을 중지합니다:
openclaw knight lockdown on
기술적 세부 사항
이 확장 프로그램은 완전히 로컬에서 실행되며 원격 측정 데이터를 전송하지 않으며 MIT 라이선스를 따릅니다. 소스는 테스트 및 기여를 위해 제공됩니다.
📖 전체 소스 읽기: r/openclaw
👀 See Also

클로드 코드가 23년 된 리눅스 커널 취약점 발견
Anthropic의 연구원 Nicholas Carlini가 Claude Code를 사용하여 Linux 커널에서 원격으로 악용 가능한 여러 힙 버퍼 오버플로우를 발견했으며, 그중 하나는 23년 동안 숨겨져 있었습니다. AI는 전체 커널 소스 트리를 스캔하면서 최소한의 감독으로 버그를 찾아냈습니다.

OpenClaw 보안 침해: 42,000개 인스턴스 노출
OpenClaw는 42,000개의 노출된 인스턴스와 341개의 악성 마켓플레이스 스킬을 포함한 중대한 보안 침해를 경험했습니다. 신속한 대응으로 Claude 에이전트를 감싸는 보안 프록시 역할을 하는 AgentVault가 개발되었습니다.

Windows Notepad 앱 원격 코드 실행 취약점 CVE-2026-20841
CVE-2026-20841는 Windows 메모장 앱의 원격 코드 실행 취약점입니다. 자세한 내용과 완화 단계는 Microsoft 보안 대응 센터 업데이트 가이드에서 확인할 수 있습니다.

llm-hasher: 하이브리드 LLM 워크플로우를 위한 로컬 PII 탐지 및 토큰화
llm-hasher는 OpenAI나 Claude와 같은 외부 LLM에 데이터가 전달되기 전에 Ollama를 사용해 개인 식별 정보를 로컬에서 탐지하고, PII를 토큰화한 후 처리 완료 시 원본을 복원하는 도구입니다. 정규식을 사용해 구조화된 데이터 유형을 탐지하고, 로컬 LLM을 사용해 문맥 기반 탐지를 수행하며, 매핑 정보는 암호화된 저장소에 보관합니다.