プロンプトフォレスト:不確実性を考慮したローカルファーストのプロンプトインジェクション検出

✍️ OpenClawRadar📅 公開日: February 14, 2026🔗 Source
プロンプトフォレスト:不確実性を考慮したローカルファーストのプロンプトインジェクション検出
Ad

PromptForestは、現在のプロンプトインジェクション検出器でよく見られる問題に対処するために作成された新しいローカルファーストライブラリです。プロンプトインジェクションとジェイルブレイクを効率的に検出し、結果に対する過信を避けるために不確実性の尺度を提供することを目指しています。このアプローチは、特にパフォーマンスを維持しながら、よりニュアンスのある出力を提供することで、従来のシステムと区別されます。

主な詳細

既存のインジェクション検出器の根本的な問題の一つは、Llama 2 8BやQualifire Sentinel 0.6Bのような大規模モデルへの依存です。これらのモデルは遅いだけでなく、結果に対する過信により誤検知が発生し、本番環境での信頼性を損なう可能性があります。これらの制限を認識し、PromptForestは3つの小型で専門化されたモデルからなる投票アンサンブル手法を活用しています:

  • Llama Prompt Guard (86M): その重量クラスで最高の事前アンサンブル期待較正誤差(ECE)を提供します。
  • Vijil Dome (ModernBERT): パラメータあたり最高の精度を提供します。
  • カスタムXGBoost: アーキテクチャの多様性のために埋め込みでトレーニングされています。

これらのモデルは、より正確なモデルがより大きな影響力を持つ加重ソフト投票方法を使用して結果を決定します。この方法は、高い精度と一貫性を維持しながら意思決定を簡素化します。

ベンチマークによると、PromptForestは平均レイテンシ約141msで動作し、Qualifire Sentinel v2の約225msと比較して、97%に対して90%の同等の精度を提供します。較正ECEも、Sentinelの0.096に対して0.070と良好な結果を示しています。スループットも印象的で、pfranger CLIを使用したコンシューマーGPUで、約27プロンプトが毎秒処理されます。

テストと実装のために、開発者はGoogle ColabでPromptForestを試したり、完全にローカルで動作するPFRangerツールでプロンプトを監査したりできます。PFRangerは並列化を利用して速度とスループットを向上させます。

📖 完全なソースを読む: r/LocalLLaMA

Ad

👀 See Also

Qwen 3.6 27B量子化ベンチマーク:実用的トレードオフでQ4_K_MがQ8_0を凌駕
Tools

Qwen 3.6 27B量子化ベンチマーク:実用的トレードオフでQ4_K_MがQ8_0を凌駕

BF16、Q4_K_M、Q8_0のGGUF量子化バリアントでQwen 3.6 27BをHumanEval、HellaSwag、BFCLで評価。Q4_K_MはBF16とほぼ同等のスコアを達成しつつ、RAM使用量48%削減、1.45倍の速度、68.8%のファイルサイズ削減を実現。

OpenClawRadar
Qwen3.6-27BとOpencodeを使った5090上でのローカルAI開発
Tools

Qwen3.6-27BとOpencodeを使った5090上でのローカルAI開発

Redditユーザーが、クラウドAIコーディングツール(Claude Code、Cursor)から、Opencode + llama-server + Qwen3.6-27B(128Kコンテキスト)を単一のRTX 5090で実行するローカル環境への切り替え体験を共有。利用制限やアカウントリスクからの解放を挙げている。

OpenClawRadar
Superglue CLI: AIエージェントが事前構築ツールなしでAPIコールを実行可能に
Tools

Superglue CLI: AIエージェントが事前構築ツールなしでAPIコールを実行可能に

Superglue CLIは、AIコーディングエージェントにそのコマンドの使用方法、認証処理、ツール構築、失敗のデバッグ方法を教えるスキルを提供します。すべてのAPI統合に対して事前構築されたツールを作成する代わりに、エージェントは実行時にAPI仕様を読み取り、複数ステップの呼び出しを計画できます。

OpenClawRadar
エージェントファクトリー:オンライン問題議論からAIエージェントを構築する自律システム
Tools

エージェントファクトリー:オンライン問題議論からAIエージェントを構築する自律システム

Agent Factoryは、Reddit、HN、GitHub、Twitterから実際の問題をスクレイピングし、需要、市場ギャップ、実現可能性でスコアリングし、有望なアイデアに対してスタンドアロンのAIエージェントを構築する自律システムです。このシステムは、7つのツールを備えた最小限のNext.jsテンプレートを使用し、シェルスクリプト経由でClaude Codeをヘッドレスで実行します。

OpenClawRadar