arifOS 15M$ : Noyau gouvernance MCP sécurise Outil OpenClaw

Ce que fait arifOS

arifOS est un noyau de gouvernance MCP minuscule qui se place entre les modèles OpenClaw et leurs outils/compétences. Le créateur, Arif (un géologue, pas un codeur), l'a construit pour empêcher les agents d'IA de "freestyler" avec ses outils sans les vérifications de sécurité appropriées.

Architecture principale

Le système utilise une métaphore simple : traiter le LLM comme un "cerveau dans un bocal", traiter les outils comme des "mains", et mettre un "VPS à 15$ au milieu comme videur". Chaque appel d'outil OpenClaw passe par cette chaîne : bocal → serveur MCP → notation → vérification de sécurité.

Implémentation de la sécurité

Chaque appel d'outil est noté de 000 à 999 et doit passer 13 étages stricts incluant :

Amanah
Vérité
Sécurité
Injection
Souveraineté

Si un appel échoue à n'importe quel étage, il renvoie "VOID" et rien ne touche votre système de fichiers, API ou base de données. La logique de blocage est simple :

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Comme le dit Arif : "C'est toute la blague : modèle à milliards de dollars, serrure à 15$."

Installation et disponibilité

Disponible via pip : pip install arifos

Dépôt : https://github.com/ariffazil/arifOS

Le créateur invite aux tests : "Si vous exécutez des agents OpenClaw et voulez un videur paranoïaque devant vos compétences, n'hésitez pas à casser ceci et à me dire où ça fuit."

Contexte de développement

Arif note que tout le code Python a été écrit par des agents d'IA, et qu'il ne "sait même pas épeler phython" — soulignant le paradoxe des non-codeurs construisant des outils de sécurité avec l'aide de l'IA.

📖 Lire la source complète : r/openclaw

arifOS : Un noyau de gouvernance MCP de 15 millions de dollars pour la sécurité de l'outil OpenClaw

Ce que fait arifOS

Architecture principale

Implémentation de la sécurité

Installation et disponibilité

Contexte de développement

👀 See Also

CVE-2026-39861 de Claude Code : Échappement du bac à sable via suivi de lien symbolique

Clawndom : Un crochet de sécurité pour Claude Code pour bloquer les paquets npm vulnérables

L'IA de pointe a bouleversé les compétitions de CTF — GPT-5.5 relève des défis Pwn insensés en un seul essai

FORGE : Cadre de test de sécurité IA open source pour les systèmes LLM