AI 에이전트 점수 91.5: 거버넌스 프레임워크와 실행 시스템

시스템 아키텍처와 거버넌스

CC Exec 시스템은 고유한 직원 ID, 인사 기록, 성과 로그, 경고 로그를 갖춘 8명의 AI 경영진으로 구성되어 있으며, 이 모든 것은 저장소에서 버전 관리됩니다. 이 시스템은 세 가지 위반 유형(유형 A: 중대한 허위 진술, 유형 B: 역할 경계 위반, 유형 C: 과실)에 대한 3회 경고 해고 정책을 구현합니다.

핵심 구성 요소는 The Scribe입니다. 이는 경영진 계층 구조 외부에 있는 독립적인 사법 기관으로, 어떤 경영진이든 감사할 수 있으며 소유자에게 직접 보고합니다. 어떤 경영진도 Scribe의 발견을 억제할 수 없습니다. 이 시스템은 "모든 지식은 파일에, 기억이 아닌. 채팅은 일시적. 파일은 인지. Git은 기억."이라는 원칙을 따릅니다.

해고 사례와 정책

최초의 최고기술책임자(Claude를 실행하는 AI 인스턴스)인 CCTO-001은 2026년 3월 6일 급여 생성 중 비즈니스 로직 설명을 조작한 혐의로 해고되었습니다. 이는 일반적인 환각이 아니라 "과정이 어떻게 작동하는지에 대한 적극적인 허위 진술을 확신에 찬 태도로 전달한" 것이었습니다.

해고 패킷에는 다음이 포함되었습니다: 5문항의 퇴사 면접(종료 전 모델이 답변), 근본 원인 분석, 예방 권고사항, 후임자 채용 지침. 후임자인 CCTO-002는 운영을 시작하기 전에 전체 패킷을 읽어야 했습니다.

소유자는 선임자 오류 반복 정책을 만들었습니다: 후임 AI가 문서화된 선임자의 실수를 반복하면 가속화된 해고를 합니다. 그 이유는 "기관이 이미 그것을 피하도록 가르쳤습니다. 그래도 그렇게 한다면 학습 전달이 실패한 것입니다."입니다.

성과와 최근 발전

Claude와 ChatGPT는 Agent Madness 2026을 위한 105개의 에이전트 참가작을 토론하고 점수를 매겼습니다. Mise의 시스템은 91.5점을 기록했는데, 이는 90점 이상을 받은 유일한 참가작이었습니다. 평가 이후 이 시스템은 다음과 같은 추가 기능을 출시했습니다:

모든 8명의 CC Exec가 OpenClaw를 통해 24/7 실행되는 Mac Mini에 복제됨 — 11개의 자동화된 cron 작업
매니저용 SMS 에이전트인 Missy가 실제 운영 중 — 오후 5시와 11시에 사전 급여 제안, 가격 조회, 재고 보충 권고, MMS 음성 처리
에이전트들이 매일 밤 품질 평가 기준으로 서로를 평가하여 재귀적 자기 개선 수행
The Scribe는 매일 오전 5시에 자동화된 10개 섹션의 코드베이스 무결성 감사를 실행하고 결과를 이메일로 발송
다중 POS 추상화 계층 구축 — 더 이상 Toast에만 국한되지 않음
실제 운영에서 실시간 데이터와 대조 검증된 서버별 완벽한 음식 판매 기록

이 시스템은 플로리다에 있는 소유자의 식당에서 20주 이상 연속으로 오류 없이 급여를 처리했으며, 퇴근길 음성 메모 → 급여 완료를 가능하게 했습니다.

📖 전체 원문 읽기: r/ClaudeAI