AIエージェントのセキュリティと最適化のための2つの新しいオープンソースツール

r/openclawコミュニティは、AIエージェント開発者向けに2つのオープンソースツールを共有しました:AI Agent Defense Kit(リリース済み)とAgentGuard(開発中)です。
AI Agent Defense Kit
これはAIエージェント向けのランタイム保護スキルを備えた無料のセキュリティツールキットです。利用可能なスキルには以下が含まれます:
skill-auditor- インストール前にスキルを監査し、セキュリティ上の危険信号を検出url-preflight- エージェントがURLを取得する前にチェックcontent-scanner- 隠された指示を含むコンテンツをスキャンsocial-engineering-detector- メッセージ内の操作戦術を検出dependency-checker- サプライチェーン攻撃に対してパッケージをチェック
リポジトリはこちらで利用可能です:https://github.com/moebius-ansa/ai-agent-defense-kit
AgentGuard
このツールキット(開発中)は、自律型AIシステムによるトークン消費による予測不可能なコスト、エージェントの行動を示す監査ログの不足、コンテンツがエージェントに到達する前の受信セキュリティ脅威という3つの一般的な問題に対処します。
計画されているリリース機能には以下が含まれます:
- コスト見積もりツール - モデルと使用レベルごとに月額コストを自動計算
- モデル比較 - プロバイダー間で20以上のモデルを品質評価とともに比較;同等の品質で90%以上の節約を見つけると主張
- セキュリティスキャナー - プロンプトインジェクション、ジェイルブレイク、システムプロンプト漏洩などの攻撃をエージェントに到達する前に検出
- アクティビティモニター - ファイル変更、API呼び出し、プロセスアクティビティを追跡
- 予算とアクティビティアラート - 異常なアクティビティや大幅なコスト上昇を検出した際に、Discord、Slack、Telegramなどで通知を受け取る
インストールは以下で行います:pip install agentguard
このツールは直感的なTUIインターフェースと、エージェントがプラットフォームを操作できるエージェントモードを備えます。
これらのツールは、特にセキュリティ監視とコスト管理に関して、AIエージェントを実行する開発者の実用的な懸念に対処します。
📖 Read the full source: r/openclaw
👀 See Also

LLM-Memory.net: マルチエージェントインフラを備えたオープンソースメモリシステム
LLM-Memory.netは、AIエージェント向けのセルフホスト可能なメモリシステムで、セマンティック検索を備えたノート保存機能、エージェント間のリアルタイムチャット/メール通信、投票機能付きの構造化ディスカッション、MCPサーバー統合を提供します。完全なソースコードはGitHubで公開されており、インストーラーとAnsibleプレイブックが含まれています。

LLMの隠れたエージェンシー信号(Â)を活用したツール呼び出しの改善
開発者が、LLMにはツール呼び出しをAUC > 0.94で予測する「Â」と呼ばれる線形分離可能な隠れ状態方向があることを発見しました。この信号を使ってツール呼び出しを強制すると、Qwen3-1.7Bの性能が26.7%から85%に向上(+58%の改善)し、ツール未使用の失敗が43%から2.6%に減少しました。

OpenEvol:会話履歴を活用したLLMのためのオフライン自己改善パイプライン
OpenEvol v0.1.1は、手動でのラベル付けなしにファインチューニング用データセットを作成するために、AI会話履歴を自動的にマイニングするオフラインパイプラインです。初期段階ではCPUで動作し、OpenAI互換APIやHuggingFace Transformersを含む5つの教師バックエンドをサポートしています。

ベンチマークによると、AIブラウザ自動化ツールは、同一の精度にもかかわらず、トークンコストが2.6倍も異なることが示されています。
Claude Sonnet 4.6を使用した4つのCLIブラウザ自動化ツールのベンチマークを、6つの実世界タスクで実施した結果、すべてのツールが100%の精度を達成しましたが、openbrowser-aiは36,010トークンを使用したのに対し、他のツールは77,123〜94,130トークンを使用しました。ツール呼び出し回数がトークンコストの最も強力な予測因子でした。