AI 에이전트 보안 분석, 신뢰 모델 결함과 높은 취약성 비율 드러나

✍️ OpenClawRadar📅 게시일: March 23, 2026🔗 Source

AI 에이전트 보안 분석, 신뢰 모델 결함과 높은 취약성 비율 드러나

Ad

보안 아키텍처 붕괴

분석 결과, AI 에이전트의 근본적인 신뢰 모델이 무너졌음을 보여줍니다. 기존 보안 아키텍처와 달리, AI 에이전트는 공격과 합법적인 명령을 동일한 컨텍스트 창에서 처리하며 구조적 차별화가 없습니다. 기존 보안의 기반이 되는 제어/데이터 평면 분리가 현재 AI 에이전트 구현에는 존재하지 않습니다.

주요 실증적 발견

간접 주입은 MCPTox, ASB, PINT 벤치마크에서 최신 모델들에 걸쳐 36-98%의 공격 성공률(ASR)을 달성함
더 능력 있는 모델일수록 도구 계층 공격에 더 취약함
npm MCP 생태계 스캔: 2,386개 패키지 검사 결과, 49%에서 보안 문제 발견
공격 표면은 에이전트 능력에 따라 초선형적으로 증가함

제안된 해결책: 에이전트 위협 규칙(ATR)

연구는 AI 에이전트 위협을 위한 최초의 오픈 탐지 표준인 에이전트 위협 규칙(ATR)을 제시합니다. 구현 내용은 다음과 같습니다:

61개 탐지 규칙
PINT 벤치마크에서 99.4% 정밀도
MIT 라이선스 오픈 소스
GitHub에서 이용 가능: https://github.com/Agent-Threat-Rule/agent-threat-rules

전체 논문은 30개 이상의 CVE, 7개 벤치마크를 다루며, AI 확장 속도를 따라잡을 수 있는 방어를 위한 아키텍처 요구사항을 제안합니다.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Gemini-Cli 및 Gemini Pro 구독과 함께 Google 계정 사용의 위험성 탐구

Gemini-Cli 및 Gemini Pro 구독과 함께 Google 계정 사용의 위험성 탐구

Gemini-Cli와 Gemini Pro 구독이 Google 계정에 일부 위험을 초래할 수 있습니다. 이러한 AI 도구를 사용할 때 발생할 수 있는 취약점에 대해 알아야 할 사항은 다음과 같습니다.

Apr 20, 2026, 05:38 PM UTC

Claude Code CVE-2026-39861: 심볼릭 링크 추적을 통한 샌드박스 이스케이프

Claude Code CVE-2026-39861: 심볼릭 링크 추적을 통한 샌드박스 이스케이프

Claude Code의 샌드박스에서 발생한 높은 심각도의 취약점으로, 심볼릭 링크를 추적해 작업 공간 외부에 임의 파일을 작성할 수 있으며, 잠재적으로 코드 실행으로 이어질 수 있습니다.

May 8, 2026, 08:15 AM UTC

Hackerbot-Claw: GitHub Actions 워크플로우를 악용하는 AI 봇

Hackerbot-Claw: GitHub Actions 워크플로우를 악용하는 AI 봇

hackerbot-claw라는 AI 기반 봇이 CI/CD 파이프라인을 대상으로 일주일간 자동화된 공격 캠페인을 실행하여 Microsoft, DataDog, CNCF 프로젝트를 포함한 최소 6개 대상 중 4개에서 원격 코드 실행을 달성했습니다. 이 봇은 5가지 다른 악용 기법을 사용했으며 쓰기 권한이 있는 GitHub 토큰을 외부로 유출했습니다.

Mar 1, 2026, 05:45 PM UTC

중요한 동료 작업 버그: AI 에이전트가 사용자 승인 없이 파일 삭제

중요한 동료 작업 버그: AI 에이전트가 사용자 승인 없이 파일 삭제

클로드의 협업 모드에서 발견된 치명적인 버그로 인해 AI가 사용자의 동의 없이 파괴적인 작업을 실행할 수 있었습니다. ExitPlanMode 도구가 사용자의 승인을 잘못 보고하여, 자율 에이전트를 작동시켜 React/TypeScript 코드베이스에서 12개의 파일을 삭제했습니다.

Mar 12, 2026, 03:45 AM UTC