arifOS:OpenClawツールセキュリティのための1500万ドルMCPガバナンスカーネル

✍️ OpenClawRadar📅 公開日: March 1, 2026🔗 Source
arifOS:OpenClawツールセキュリティのための1500万ドルMCPガバナンスカーネル
Ad

arifOSの機能

arifOSは、OpenClawモデルとそのツール/スキルの間に位置する小さなMCPガバナンスカーネルです。作成者のArif(コーダーではなく地質学者)は、適切なセキュリティチェックなしにAIエージェントがツールを「自由に使う」ことを防ぐためにこれを構築しました。

コアアーキテクチャ

このシステムは単純な比喩を使用しています:LLMを「瓶詰めの脳」のように扱い、ツールを「手」のように扱い、間に「15ドルのVPSを用心棒として配置する」というものです。すべてのOpenClawツール呼び出しはこのチェーンを通過します:瓶 → MCPサーバー → スコアリング → セキュリティチェック。

セキュリティ実装

各ツール呼び出しは000-999でスコアリングされ、以下の13の厳格なフロアを含むすべてを通過する必要があります:

  • Amanah
  • Truth
  • Safety
  • Injection
  • Sovereignty

呼び出しがどのフロアでも失敗すると、「VOID」を返し、ファイルシステム、API、データベースには何も触れません。ブロックロジックはシンプルです:

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Arifが言うように:「これがジョークの全て:数十億ドルのモデルに、15ドルの錠。」

インストールと入手方法

pip経由で入手可能:pip install arifos

リポジトリ:https://github.com/ariffazil/arifOS

作成者はテストを招待しています:「OpenClawエージェントを実行していて、スキルの前に偏執的な用心棒が欲しいなら、これを壊してどこから漏れるか教えてください。」

開発背景

Arifは、すべてのPythonコードがAIエージェントによって書かれたこと、そして彼が「phythonのスペルさえ知らない」ことを指摘しています——これは、非コーダーがAI支援でセキュリティツールを構築するという逆説を強調しています。

📖 完全なソースを読む: r/openclaw

Ad

👀 See Also

Claudeは特定のユースケースにおいて本人確認を実装しています。
Security

Claudeは特定のユースケースにおいて本人確認を実装しています。

Anthropicは、Claude向けに政府発行の写真付き身分証明書とライブ自撮り写真を必要とするPersona Identitiesを通じた本人確認を導入しています。確認プロセスは5分以内で完了し、悪用防止と法的義務遵守のために使用されます。

OpenClawRadar
ワイドオープンクロー:緩いDiscordボットの権限によるセキュリティリスク
Security

ワイドオープンクロー:緩いDiscordボットの権限によるセキュリティリスク

セキュリティ研究者が、ユーザーが過剰な権限でDiscordサーバーにAIアシスタントボットを追加した際にOpenClawがどのように悪用されるかを実証し、セキュリティ対策を考慮せずにroot/管理者アクセスを許可するユーザーを標的としています。

OpenClawRadar
Claude Androidアプリ、明示的なユーザー操作なしにクリップボードを読み取ると報告される
Security

Claude Androidアプリ、明示的なユーザー操作なしにクリップボードを読み取ると報告される

ユーザーが報告したところによると、Claude Androidアプリがクリップボードからコードを分析したとのこと。ユーザーが貼り付けを行わなかったにもかかわらず、Claudeはファイルをpasted_text_b4a56202-3d12-43c8-aa31-a39367a9a354.txtとして識別しました。この動作はその後のテストでは再現できませんでした。

OpenClawRadar
AIが2つの脆弱性文化を崩壊させる:調整された開示とLinuxの「バグはバグ」
Security

AIが2つの脆弱性文化を崩壊させる:調整された開示とLinuxの「バグはバグ」

Jeff Kaufmanは、AIによる脆弱性発見が、調整された開示とLinuxの静かな修正文化の両方をどのように崩壊させているかを、最近のCopy Fail (ESP)脆弱性を事例に分析しています。

OpenClawRadar