arifOS: Núcleo MCP de $15M para seguridad OpenClaw

Qué hace arifOS

arifOS es un pequeño núcleo de gobernanza MCP que se sitúa entre los modelos de OpenClaw y sus herramientas/habilidades. El creador, Arif (un geólogo, no un programador), lo construyó para evitar que los agentes de IA "improvisen" con sus herramientas sin las comprobaciones de seguridad adecuadas.

Arquitectura principal

El sistema utiliza una metáfora simple: trata al LLM como un "cerebro en un frasco", trata las herramientas como "manos" y coloca "un VPS de $15 en el medio como portero". Cada llamada a herramienta de OpenClaw pasa por esta cadena: frasco → servidor MCP → puntuación → comprobación de seguridad.

Implementación de seguridad

Cada llamada a herramienta recibe una puntuación de 000 a 999 y debe pasar 13 Pisos duros que incluyen:

Amanah
Verdad
Seguridad
Inyección
Soberanía

Si una llamada falla en cualquier Piso, devuelve "VOID" y nada toca tu sistema de archivos, API o base de datos. La lógica de bloqueo es sencilla:

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Como dice Arif: "Esa es toda la broma: modelo de mil millones de dólares, cerradura de $15."

Instalación y disponibilidad

Disponible vía pip: pip install arifos

Repositorio: https://github.com/ariffazil/arifOS

El creador invita a probarlo: "Si estás ejecutando agentes de OpenClaw y quieres un portero paranoico delante de tus habilidades, siéntete libre de romper esto y dime dónde tiene fugas."

Contexto de desarrollo

Arif señala que todo el código Python fue escrito por agentes de IA, y que él "ni siquiera sabe deletrear phython"—destacando la paradoja de que no-programadores construyan herramientas de seguridad con asistencia de IA.

📖 Read the full source: r/openclaw

arifOS: Un núcleo de gobernanza MCP de $15 millones para la seguridad de la herramienta OpenClaw

Qué hace arifOS

Arquitectura principal

Implementación de seguridad

Instalación y disponibilidad

Contexto de desarrollo

👀 Ver también

Los Guardarrieles de los Agentes de IA se Deterioran con el Tiempo sin Mantenimiento Activo

Vulnerabilidades de Seguridad de la Función 'Permitir Siempre' de OpenClaw y Alternativas Más Seguras

Agente de IA Explota Inyección SQL para Comprometer el Chatbot Lilli de McKinsey

openclaw-credential-vault aborda cuatro rutas de fuga de credenciales en agentes de IA