arifOS: MCP-ядро за $15 млн для безопасности OpenClaw

Что делает arifOS

arifOS — это крошечное ядро управления MCP, которое находится между моделями OpenClaw и их инструментами/навыками. Создатель, Ариф (геолог, а не программист), построил его, чтобы предотвратить «вольное обращение» ИИ-агентов с его инструментами без надлежащих проверок безопасности.

Основная архитектура

Система использует простую метафору: рассматривать LLM как «мозг в банке», инструменты — как «руки», а «посередине поставить VPS за $15 в качестве вышибалы». Каждый вызов инструмента OpenClaw проходит по этой цепочке: банка → MCP-сервер → оценка → проверка безопасности.

Реализация безопасности

Каждый вызов инструмента получает оценку от 000 до 999 и должен пройти 13 строгих Уровней, включая:

Амана (Доверие)
Истина
Безопасность
Инъекция
Суверенитет

Если вызов не проходит любой Уровень, он возвращает «VOID», и ничего не касается вашей файловой системы, API или базы данных. Логика блокировки проста:

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Как говорит Ариф: «В этом вся шутка: модель за миллиард долларов, замок за 15».

Установка и доступность

Доступно через pip: pip install arifos

Репозиторий: https://github.com/ariffazil/arifOS

Создатель приглашает к тестированию: «Если вы запускаете агентов OpenClaw и хотите параноидального вышибалы перед своими навыками, не стесняйтесь ломать это и рассказывать мне, где оно протекает».

Контекст разработки

Ариф отмечает, что весь код на Python был написан ИИ-агентами, и он «даже не знает, как пишется phython» — подчеркивая парадокс того, что не-программисты создают инструменты безопасности с помощью ИИ.

📖 Read the full source: r/openclaw

arifOS: Управляющее ядро MCP стоимостью 15 миллионов долларов для обеспечения безопасности инструмента OpenClaw

Что делает arifOS

Основная архитектура

Реализация безопасности

Установка и доступность

Контекст разработки

👀 Смотрите также

Уязвимость в Snowflake Cortex Code CLI позволяла обходить песочницу и выполнять вредоносный код

Анализ безопасности ИИ-агентов выявляет нарушенную модель доверия и высокий уровень уязвимостей.

Расширение Claude Code для VS Code раскрывает состояние выделения в закрытых файлах и новых сессиях

Исходный код платформы электронного правительства Швеции утек из-за взлома инфраструктуры CGI