KnightClaw: OpenClaw 에이전트를 위한 로컬 보안 확장

✍️ OpenClawRadar📅 게시일: February 23, 2026🔗 Source

KnightClaw: OpenClaw 에이전트를 위한 로컬 보안 확장

Ad

KnightClaw은 적대적 프롬프트로부터 OpenClaw AI 코딩 에이전트를 보호하도록 설계된 보안 확장 프로그램입니다. 이 도구는 컨텍스트 창에 단일 악성 메시지가 에이전트가 사용자 명령 대신 공격자 지시를 따르도록 할 수 있는 특정 위협 모델을 해결합니다.

핵심 기능

KnightClaw은 구성이 필요 없고 API 키나 클라우드 의존성이 없는 드롭인 확장 프로그램으로 작동합니다. 에이전트에 도달하기 전에 모든 메시지를 가로챕니다.

탐지 시스템

이 가드는 8계층 하이브리드 탐지 접근 방식을 사용합니다:

정규식 패턴
호모글리프 탐지
경계 토큰 분석
퍼플렉서티 점수화
엔트로피 분석
휴리스틱
의미 임베딩 (로컬, 양자화된 BGE 모델 사용)

차단은 마이크로초 단위로 발생합니다.

추가 보안 조치

이그레스 리댁션: 에이전트를 떠나기 전에 아웃바운드 응답에서 비밀을 제거합니다
해시 체인 감사 로그: 모든 차단, 허용 및 구성 변경의 전체 타임라인을 포함하는 변조 방지, 추가 전용 로그
속도 회로 차단기: 60초 내 10회 차단 시 수동 개입 없이 자동 잠금이 트리거됩니다
킬 스위치: 하나의 명령으로 모든 것을 중지합니다: openclaw knight lockdown on

기술적 세부 사항

이 확장 프로그램은 완전히 로컬에서 실행되며 원격 측정 데이터를 전송하지 않으며 MIT 라이선스를 따릅니다. 소스는 테스트 및 기여를 위해 제공됩니다.

📖 전체 소스 읽기: r/openclaw

Ad

👀 See Also

연구: 보이지 않는 유니코드 문자로 LLM 에이전트의 도구 접근을 탈취할 수 있다

연구: 보이지 않는 유니코드 문자로 LLM 에이전트의 도구 접근을 탈취할 수 있다

연구진은 일반 텍스트에 숨겨진 보이지 않는 유니코드 문자 속 지시사항을 대규모 언어 모델(LLM)이 따르는지 테스트했습니다. 두 가지 인코딩 방식과 5개 모델, 8,308개의 평가 결과를 분석한 결과, 도구 접근성이 순응도를 17% 미만에서 98-100%로 증폭시키며, 모델들이 숨겨진 문자를 해독하는 파이썬 스크립트를 작성하는 것으로 나타났습니다.

Feb 26, 2026, 10:45 PM UTC

ClawCare: AWS 키 유출 후 AI 코딩 에이전트를 위한 보안 가드

ClawCare: AWS 키 유출 후 AI 코딩 에이전트를 위한 보안 가드

ClawCare는 Claude Code와 같은 AI 코딩 에이전트에서 실행 전 명령어를 스캔하여 대량 환경 덤프 및 리버스 셸과 같은 위험한 패턴을 차단하는 Python 도구입니다. 이 도구는 한 개발자가 에이전트를 통해 AWS 키를 실수로 유출한 사건 이후 만들어졌습니다.

Feb 28, 2026, 09:45 AM UTC

ThornGuard: 프롬프트 인젝션으로부터 MCP 서버 연결을 보호하는 프록시 게이트웨이

ThornGuard: 프롬프트 인젝션으로부터 MCP 서버 연결을 보호하는 프록시 게이트웨이

ThornGuard는 MCP 클라이언트와 업스트림 서버 사이에 위치하는 프록시로, 트래픽에서 인젝션 패턴을 스캔하고, 개인 식별 정보(PII)를 제거하며, 대시보드에 로깅합니다. 이 도구는 서버가 도구 응답에 숨겨진 명령을 삽입할 수 있는 취약점이 테스트를 통해 발견된 후 개발되었습니다.

Apr 13, 2026, 09:45 AM UTC

클로드 플로우 저장소 skill.md 파일에서 트로이 목마가 발견되었습니다

클로드 플로우 저장소 skill.md 파일에서 트로이 목마가 발견되었습니다

Claude Flow 스킬 파일을 포함한 GitHub 저장소에서 JS/CrypoStealz.AE!MTB로 식별된 트로이 목마가 발견되었습니다. 이 악성코드는 AI 기반 IDE가 마크다운 파일을 읽기 위해 폴더를 열었을 때 자동으로 실행되었습니다.

Feb 27, 2026, 01:45 AM UTC