arifOS:OpenClawツールセキュリティのための1500万ドルMCPガバナンスカーネル

arifOSの機能
arifOSは、OpenClawモデルとそのツール/スキルの間に位置する小さなMCPガバナンスカーネルです。作成者のArif(コーダーではなく地質学者)は、適切なセキュリティチェックなしにAIエージェントがツールを「自由に使う」ことを防ぐためにこれを構築しました。
コアアーキテクチャ
このシステムは単純な比喩を使用しています:LLMを「瓶詰めの脳」のように扱い、ツールを「手」のように扱い、間に「15ドルのVPSを用心棒として配置する」というものです。すべてのOpenClawツール呼び出しはこのチェーンを通過します:瓶 → MCPサーバー → スコアリング → セキュリティチェック。
セキュリティ実装
各ツール呼び出しは000-999でスコアリングされ、以下の13の厳格なフロアを含むすべてを通過する必要があります:
- Amanah
- Truth
- Safety
- Injection
- Sovereignty
呼び出しがどのフロアでも失敗すると、「VOID」を返し、ファイルシステム、API、データベースには何も触れません。ブロックロジックはシンプルです:
if verdict == "VOID":
return "Action Blocked by Floor 1: Amanah"Arifが言うように:「これがジョークの全て:数十億ドルのモデルに、15ドルの錠。」
インストールと入手方法
pip経由で入手可能:pip install arifos
リポジトリ:https://github.com/ariffazil/arifOS
作成者はテストを招待しています:「OpenClawエージェントを実行していて、スキルの前に偏執的な用心棒が欲しいなら、これを壊してどこから漏れるか教えてください。」
開発背景
Arifは、すべてのPythonコードがAIエージェントによって書かれたこと、そして彼が「phythonのスペルさえ知らない」ことを指摘しています——これは、非コーダーがAI支援でセキュリティツールを構築するという逆説を強調しています。
📖 完全なソースを読む: r/openclaw
👀 See Also

Claudeは特定のユースケースにおいて本人確認を実装しています。
Anthropicは、Claude向けに政府発行の写真付き身分証明書とライブ自撮り写真を必要とするPersona Identitiesを通じた本人確認を導入しています。確認プロセスは5分以内で完了し、悪用防止と法的義務遵守のために使用されます。

ワイドオープンクロー:緩いDiscordボットの権限によるセキュリティリスク
セキュリティ研究者が、ユーザーが過剰な権限でDiscordサーバーにAIアシスタントボットを追加した際にOpenClawがどのように悪用されるかを実証し、セキュリティ対策を考慮せずにroot/管理者アクセスを許可するユーザーを標的としています。

Claude Androidアプリ、明示的なユーザー操作なしにクリップボードを読み取ると報告される
ユーザーが報告したところによると、Claude Androidアプリがクリップボードからコードを分析したとのこと。ユーザーが貼り付けを行わなかったにもかかわらず、Claudeはファイルをpasted_text_b4a56202-3d12-43c8-aa31-a39367a9a354.txtとして識別しました。この動作はその後のテストでは再現できませんでした。

AIが2つの脆弱性文化を崩壊させる:調整された開示とLinuxの「バグはバグ」
Jeff Kaufmanは、AIによる脆弱性発見が、調整された開示とLinuxの静かな修正文化の両方をどのように崩壊させているかを、最近のCopy Fail (ESP)脆弱性を事例に分析しています。