그룹 채팅 어시스턴트 프롬프트 인젝션 차단 방법

r/ClaudeAI 게시물 "그룹 채팅 어시스턴트의 프롬프트 인젝션 완화: VM 및 OAuth 도구 실행을 관리자 승인까지 일시 중단"은 공용 또는 공유 채널(예: Supergreen을 통한 WhatsApp 또는 그룹 채팅)에 연결된 LLM 기반 어시스턴트를 위한 실용적인 보안 패턴을 설명합니다. 핵심 문제: 여러 사용자가 동일한 세션 기록을 공유할 때, 모든 참가자가 어시스턴트에 프롬프트 인젝션을 수행하여 위험한 도구(클라우드 리소스 생성, 매핑된 비밀이 포함된 코드 실행, OAuth 토큰 가져오기 등)를 트리거할 수 있습니다.

안전한 관리자 승인 절차

prompt2bot에서 제안된 해결책은 고위험 도구 실행을 가로채는 안전한 관리자 승인 절차입니다:

비관리자 사용자가 create_vm, run_safescript(매핑된 비밀이 있는 맞춤 코드 실행), 또는 OAuth 흐름을 트리거하면 도구가 실행을 일시 중단하고 "관리자 권한 요청 중..."을 반환합니다.
10분 TTL이 있는 승인 링크가 WhatsApp 또는 이메일을 통해 구성된 관리자에게 자동으로 전송됩니다.
승인되면 백그라운드 작업이 대화 기록에 시스템 알림을 삽입합니다: [시스템 알림: 관리자가 <toolName> 실행 요청(요청 ID: <requestId>)을 승인했습니다.].
이 생각 주입은 에이전트 루프를 깨우고, 승인된 request_id로 도구를 다시 호출하여 원활하게 계속 실행합니다.
게스트 사용자(이메일/전화번호가 설정되지 않은 봇 소유자)의 경우 개발자 테스트의 원활함을 위해 승인이 생략됩니다.