arifOS: 오픈클로 도구 보안을 위한 1500만 달러 규모의 MCP 거버넌스 커널

arifOS의 기능
arifOS는 OpenClaw 모델과 그들의 도구/기능 사이에 위치하는 작은 MCP 거버넌스 커널입니다. 창시자인 Arif(지질학자, 코더 아님)는 적절한 보안 검사 없이 AI 에이전트가 자신의 도구를 "자유롭게 사용"하는 것을 방지하기 위해 이를 구축했습니다.
핵심 아키텍처
이 시스템은 간단한 비유를 사용합니다: LLM을 "항아리 속 뇌"처럼 취급하고, 도구를 "손"처럼 취급하며, 중간에 "15달러 VPS를 경비원으로" 배치합니다. 모든 OpenClaw 도구 호출은 이 체인을 통과합니다: 항아리 → MCP 서버 → 점수 매기기 → 보안 검사.
보안 구현
각 도구 호출은 000-999 점수를 받으며 다음을 포함한 13개의 강력한 단계를 통과해야 합니다:
- Amanah
- Truth
- Safety
- Injection
- Sovereignty
호출이 어떤 단계에서든 실패하면 "VOID"를 반환하고 파일 시스템, API 또는 데이터베이스에 아무것도 접촉하지 않습니다. 차단 로직은 간단합니다:
if verdict == "VOID":
return "Action Blocked by Floor 1: Amanah"Arif가 표현한 대로: "그게 바로 요점입니다: 10억 달러 모델, 15달러 자물쇠."
설치 및 이용 가능성
pip를 통해 이용 가능: pip install arifos
저장소: https://github.com/ariffazil/arifOS
창시자는 테스트를 초대합니다: "OpenClaw 에이전트를 실행 중이고 당신의 기능 앞에 편집증적인 경비원을 원한다면, 이걸 깨뜨리고 어디서 새는지 알려주세요."
개발 배경
Arif는 모든 Python 코드가 AI 에이전트에 의해 작성되었으며, 그는 "파이썬 철자도 모른다"고 언급하며, 비코더가 AI 도움으로 보안 도구를 구축하는 역설을 강조합니다.
📖 전체 출처 읽기: r/openclaw
👀 See Also

보안 감사 결과, Anthropic의 MCP 참조 서버에 취약점이 발견되어 환각 기반 취약점이 도입된 것으로 나타났습니다.
100개의 MCP 서버 패키지에 대한 보안 감사 결과 71%가 F 등급을 받았으며, 여기에는 Anthropic의 공식 GitHub 및 파일시스템 참조 구현체도 포함됩니다. 이 감사는 보안 취약점을 만들고 추론 루프를 통해 토큰을 낭비하는 환각 기반 취약점을 식별했습니다.

샌드박싱 오픈클로: AI 코딩에서 보안 강화하기
샌드박싱은 AI 코딩 에이전트를 보호하는 중요한 기술로, OpenClaw 커뮤니티의 최신 논의를 살펴보세요. 사용자들이 AI 혁신을 보호하기 위해 이것이 필수적이라고 믿는 이유를 탐구해 보세요.

사기 경고: 가짜 GitHub 에어드롭이 CLAW 토큰 사용자를 노립니다
GitHub 기여에 대한 $CLAW 토큰 에어드롭을 제공한다고 주장하는 피싱 사기가 유포되고 있습니다. 이 사기는 Google 공유 링크를 사용하여 의심스러운 .xyz 사이트로 리디렉션하고 사용자에게 지갑 연결을 요청하여 지갑 자금을 탈취할 수 있습니다.
AI 에이전트 보안: 토큰 예산이 데이터 유출 위험을 결정한다
한 개발자가 Gmail에 연결된 AI 에이전트를 테스트했습니다: 프론티어 모델은 피싱을 잡아냈고, 중간 티어는 불안정했으며, 저렴한 모델은 악성 이메일을 조용히 전달했습니다. 아키텍처 보호(샌드박싱, 권한)는 단 한 번의 시도도 막지 못했습니다.