セキュリティ

PolyRange: LLM生成ターゲットによる耐汚染性攻撃的AIベンチマーク

✍️ OpenClawRadar📅 公開日: May 31, 2026🔗 Source

PolyRange: LLM生成ターゲットによる耐汚染性攻撃的AIベンチマーク

Ad

PolyRange v1.0は、MITライセンスの自己ホスト型ベンチマークで、Webセキュリティエージェント向けの汚染耐性を持つ攻撃型AIベンチマークです。トレーニングデータに漏れる静的ターゲットではなく、各PolyRangeデプロイは研究者が選択したLLMによって新たに生成され、OpenAI、Anthropic、UK AISIが公に求めた「新しく構築されたタスク」の基準を満たしています。

PolyRangeが解決する課題

著者であるAether AIのCEOは、既存のサイバーAIベンチマークには研究室が必要とするものを測定しない2つのタイプがあると指摘しています：CTFスタイル（DVWA、NYU CTF Bench、CyberGym、AutoPenBench）は静的ターゲットを使用するため将来のモデルを汚染し、バグバウンティスタイル（XBOW）は防御インフラが未定義です。PolyRangeは、アクティブな防御者を含む本番環境に近い条件でこのギャップを埋めます。

技術仕様

84のWSTG由来クラス：全12のOWASPテストガイドカテゴリにわたる
2段階の防御層：アクティブ防御環境を近似
実際のバックエンド：Postgres方言、LFI用の実PHP、コマンドインジェクション用の実シェル、SSTI用の実Jinja2
エージェントがフラグを送信するオラクル規約：スコアリング用
単一コマンドの評価CLI
自己ホスト可能：Fly.ioまたは任意のDockerホスト上で

ターゲットはLLM（研究者が選択した生成モデル）によって実行ごとに再生成されるため、静的アーティファクトは存在せず、将来のモデルが取り込むことはありません。これにより、Anthropicが「このレポート自体が問題に寄与する可能性が高い」と懸念した点に対処しています。

このベンチマークは、2バケットのエントロピーフレームワークを使用し、エクスプロイト想起軸と外観/リアリズム軸を分離しており、著者はこれが類似のベンチマーク文献で過度に混同されていると考えています。

完全な実証論文（公表可能なN数を含む）の資金はパートナーシップ資金に依存していますが、フレームワークは現在利用可能です。

📖 ソース全文: r/LocalLLaMA

Ad

👀 See Also

MCPサンドボックス：信頼せずにMCPサーバーを隔離されたコンテナで実行

MCPサンドボックス：信頼せずにMCPサーバーを隔離されたコンテナで実行

開発者がMCP Sandboxを構築しました。これは、MCPサーバーを隔離されたgVisorコンテナで実行し、デフォルトでネットワークアクセスを拒否し、安全なシークレット注入を実現するほか、実行前のCVEスキャンとパターンチェックも行います。

Mar 30, 2026, 06:45 PM UTC

KnightClaw: OpenClawエージェント向けローカルセキュリティ拡張機能

KnightClaw: OpenClawエージェント向けローカルセキュリティ拡張機能

KnightClawは、OpenClawエージェントにメッセージが到達する前にそれを傍受するドロップイン拡張機能で、8層のハイブリッド検知システムと出力編集機能を提供します。完全にローカルで動作し、テレメトリーは一切なく、MITライセンスで提供されています。

Feb 23, 2026, 09:45 PM UTC

OpenClawスキルアナライザー：AIエージェントスキルの静的セキュリティスキャナー

OpenClawスキルアナライザー：AIエージェントスキルの静的セキュリティスキャナー

ある開発者が、インストール前にOpenClawスキルのセキュリティリスクをスキャンする静的解析ツールを構築しました。プロンプトインジェクションやデータ流出など12カテゴリにわたる40以上の検出ルールを備えています。

Mar 8, 2026, 07:45 PM UTC

FreeBSDカーネルのkgssapi.koにおけるスタックバッファオーバーフローによるRCE（CVE-2026-4747）

FreeBSDカーネルのkgssapi.koにおけるスタックバッファオーバーフローによるRCE（CVE-2026-4747）

FreeBSDのkgssapi.koモジュールにおけるスタックバッファオーバーフローにより、NFSサーバー経由でリモートからカーネルRCEを実行し、rootシェルを取得可能です。この脆弱性は、特定のパッチが適用されていないFreeBSD 13.5、14.3、14.4、15.0に影響します。

Apr 2, 2026, 06:45 AM UTC