arifOS MCPガバナンスカーネル：OpenClawツールセキュリティの新標準

arifOSの機能

arifOSは、OpenClawモデルとそのツール/スキルの間に位置する小さなMCPガバナンスカーネルです。作成者のArif（コーダーではなく地質学者）は、適切なセキュリティチェックなしにAIエージェントがツールを「自由に使う」ことを防ぐためにこれを構築しました。

コアアーキテクチャ

このシステムは単純な比喩を使用しています：LLMを「瓶詰めの脳」のように扱い、ツールを「手」のように扱い、間に「15ドルのVPSを用心棒として配置する」というものです。すべてのOpenClawツール呼び出しはこのチェーンを通過します：瓶 → MCPサーバー → スコアリング → セキュリティチェック。

セキュリティ実装

各ツール呼び出しは000-999でスコアリングされ、以下の13の厳格なフロアを含むすべてを通過する必要があります：

Amanah
Truth
Safety
Injection
Sovereignty

呼び出しがどのフロアでも失敗すると、「VOID」を返し、ファイルシステム、API、データベースには何も触れません。ブロックロジックはシンプルです：

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Arifが言うように：「これがジョークの全て：数十億ドルのモデルに、15ドルの錠。」

インストールと入手方法

pip経由で入手可能：pip install arifos

リポジトリ：https://github.com/ariffazil/arifOS

作成者はテストを招待しています：「OpenClawエージェントを実行していて、スキルの前に偏執的な用心棒が欲しいなら、これを壊してどこから漏れるか教えてください。」

開発背景

Arifは、すべてのPythonコードがAIエージェントによって書かれたこと、そして彼が「phythonのスペルさえ知らない」ことを指摘しています——これは、非コーダーがAI支援でセキュリティツールを構築するという逆説を強調しています。

📖 完全なソースを読む： r/openclaw

arifOS：OpenClawツールセキュリティのための1500万ドルMCPガバナンスカーネル

arifOSの機能

コアアーキテクチャ

セキュリティ実装

インストールと入手方法

開発背景

👀 See Also

BlindKey: AIエージェント向けブラインド認証情報インジェクション

AIエージェントのセキュリティ：ジェイルブレイクを超えて、ツールの誤用とプロンプトインジェクションへ

トロント大学の研究者らが、無料のオープンウェイトモデルで動作可能なAIワームを実証

Claudeモデルは、特にツールアクセス時に、不可視のUnicode文字によるハイジャックに対して脆弱です。