PolyRange: LLM 생성 타겟을 사용한 오염 방지 공격적 AI 벤치마크

✍️ OpenClawRadar📅 게시일: May 31, 2026🔗 Source

PolyRange: LLM 생성 타겟을 사용한 오염 방지 공격적 AI 벤치마크

Ad

PolyRange v1.0은 웹 보안 에이전트를 위한 MIT 라이선스의 오염 방지 오펜시브 AI 벤치마크입니다. 훈련 코퍼스에 유출되는 정적 대상 대신, 각 PolyRange 배포는 연구자가 선택한 LLM에 의해 새롭게 생성됩니다. 이는 OpenAI, Anthropic, UK AISI가 공개적으로 요청한 '새로 구축된 작업' 기준을 충족합니다.

PolyRange가 해결하는 문제

Aether AI의 CEO인 저자는 기존 사이버-AI 벤치마크가 실험실이 필요로 하는 것을 측정하지 않는 두 가지 유형으로 나뉜다고 지적합니다. CTF 스타일 벤치마크(DVWA, NYU CTF Bench, CyberGym, AutoPenBench)는 정적 대상을 사용하여 미래 모델을 오염시키고, 버그 바운티 스타일 벤치마크(XBOW)는 방어 인프라가 정의되지 않습니다. PolyRange는 능동적 방어자를 포함한 프로덕션 수준 조건으로 이 격차를 해소합니다.

기술 사양

84개 WSTG 기반 클래스: 12개 OWASP 테스트 가이드 범주 전체 포함
두 가지 방어 계층: 능동적 방어자 조건 근사
실제 백엔드: Postgres 방언, LFI용 실제 PHP, 명령 주입용 실제 셸, SSTI용 실제 Jinja2
에이전트 제출 플래그 오라클 규칙: 점수 측정용
단일 명령 평가 CLI
자체 호스팅 가능: Fly.io 또는 모든 Docker 호스트에서

대상은 LLM(연구자가 선택한 생성 모델)을 통해 실행마다 재생성되므로, 미래 모델이 학습할 정적 아티팩트가 없습니다. 이는 '이 보고서 자체가 문제에 기여할 가능성이 높다'는 Anthropic의 우려를 해결합니다.

벤치마크는 익스플로잇-리콜 축과 미적/현실감 축을 분리하는 2-버킷 엔트로피 프레임워크를 사용하며, 저자는 인접한 벤치마크 문헌에서 이 개념이 과도하게 혼합되었다고 생각합니다.

전체 실증 논문(출판 가능한 N-결과 포함)을 위한 자금은 파트너십 지원에 달려 있지만, 프레임워크는 현재 사용 가능합니다.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

신뢰의 인간적 근원: 자율적 AI 에이전트에 대한 책임성 확립

신뢰의 인간적 근원: 자율적 AI 에이전트에 대한 책임성 확립

Human Root of Trust는 암호화 수단을 통해 자율적 AI 에이전트의 책임성 부재 문제를 해결하는 공개 도메인 프레임워크입니다.

Feb 22, 2026, 09:45 AM UTC

VulnHunter: Capital One의 에이전틱 AI 코드 보안 툴, 이제 오픈 소스로

VulnHunter: Capital One의 에이전틱 AI 코드 보안 툴, 이제 오픈 소스로

Capital One이 VulnHunter를 오픈소스로 공개했습니다. 이 에이전틱 AI 도구는 공격자 진입점을 시뮬레이션하고, 거짓 긍정을 줄이기 위해 발견 결과를 검증하며, 대상별 코드 수정을 생성합니다.

Jul 18, 2026, 12:15 AM UTC

SkillFence 소개: 스킬의 실제 동작을 감시하는 새로운 런타임 모니터

SkillFence 소개: 스킬의 실제 동작을 감시하는 새로운 런타임 모니터

SkillFence는 AI 에이전트 동작 모니터링에 있어 혁신적인 돌파구를 제시하여, AI 기반 환경에서의 투명성과 보안 요구를 해결합니다. 이 혁신적인 도구가 자율적 프로세스에 대한 통제력을 어떻게 강화할 수 있는지 알아보세요.

Feb 8, 2026, 01:45 PM UTC

AI를 인간보다 더 신뢰하지 마세요 — 동일한 접근 통제를 적용하세요

AI를 인간보다 더 신뢰하지 마세요 — 동일한 접근 통제를 적용하세요

Reddit 토론에서는 AI 코딩 에이전트를 주니어 개발자처럼 대우해야 한다고 주장합니다 — 프로덕션 접근 금지, 직접 쓰기 금지, CI/CD 파이프라인 및 역할 기반 권한 적용.

Apr 30, 2026, 02:15 AM UTC