arifOS: MCP 거버넌스 커널로 오픈클로 도구 보안 강화

arifOS의 기능

arifOS는 OpenClaw 모델과 그들의 도구/기능 사이에 위치하는 작은 MCP 거버넌스 커널입니다. 창시자인 Arif(지질학자, 코더 아님)는 적절한 보안 검사 없이 AI 에이전트가 자신의 도구를 "자유롭게 사용"하는 것을 방지하기 위해 이를 구축했습니다.

핵심 아키텍처

이 시스템은 간단한 비유를 사용합니다: LLM을 "항아리 속 뇌"처럼 취급하고, 도구를 "손"처럼 취급하며, 중간에 "15달러 VPS를 경비원으로" 배치합니다. 모든 OpenClaw 도구 호출은 이 체인을 통과합니다: 항아리 → MCP 서버 → 점수 매기기 → 보안 검사.

보안 구현

각 도구 호출은 000-999 점수를 받으며 다음을 포함한 13개의 강력한 단계를 통과해야 합니다:

Amanah
Truth
Safety
Injection
Sovereignty

호출이 어떤 단계에서든 실패하면 "VOID"를 반환하고 파일 시스템, API 또는 데이터베이스에 아무것도 접촉하지 않습니다. 차단 로직은 간단합니다:

if verdict == "VOID":
    return "Action Blocked by Floor 1: Amanah"

Arif가 표현한 대로: "그게 바로 요점입니다: 10억 달러 모델, 15달러 자물쇠."

설치 및 이용 가능성

pip를 통해 이용 가능: pip install arifos

저장소: https://github.com/ariffazil/arifOS

창시자는 테스트를 초대합니다: "OpenClaw 에이전트를 실행 중이고 당신의 기능 앞에 편집증적인 경비원을 원한다면, 이걸 깨뜨리고 어디서 새는지 알려주세요."

개발 배경

Arif는 모든 Python 코드가 AI 에이전트에 의해 작성되었으며, 그는 "파이썬 철자도 모른다"고 언급하며, 비코더가 AI 도움으로 보안 도구를 구축하는 역설을 강조합니다.

📖 전체 출처 읽기: r/openclaw

arifOS: 오픈클로 도구 보안을 위한 1500만 달러 규모의 MCP 거버넌스 커널

arifOS의 기능

핵심 아키텍처

보안 구현

설치 및 이용 가능성

개발 배경

👀 See Also

구글이 밝힌 바에 따르면 범죄 해커들이 AI를 활용해 제로데이 취약점을 발견했다

TEE 인클레이브를 사용한 암호화된 LLM 추론을 위한 OpenClaw 구성

AI 코딩 어시스턴트를 위한 필수 파일 차단: 실용적인 보안 체크리스트

A2A 보안: 개발자가 OpenClaw 에이전트 간 암호화 통신을 구축한 방법