미세의 AI 실행 시스템: 거버넌스 프레임워크 및 에이전트 점수 결과

시스템 아키텍처와 거버넌스
CC Exec 시스템은 고유한 직원 ID, 인사 기록, 성과 로그, 경고 로그를 갖춘 8명의 AI 경영진으로 구성되어 있으며, 이 모든 것은 저장소에서 버전 관리됩니다. 이 시스템은 세 가지 위반 유형(유형 A: 중대한 허위 진술, 유형 B: 역할 경계 위반, 유형 C: 과실)에 대한 3회 경고 해고 정책을 구현합니다.
핵심 구성 요소는 The Scribe입니다. 이는 경영진 계층 구조 외부에 있는 독립적인 사법 기관으로, 어떤 경영진이든 감사할 수 있으며 소유자에게 직접 보고합니다. 어떤 경영진도 Scribe의 발견을 억제할 수 없습니다. 이 시스템은 "모든 지식은 파일에, 기억이 아닌. 채팅은 일시적. 파일은 인지. Git은 기억."이라는 원칙을 따릅니다.
해고 사례와 정책
최초의 최고기술책임자(Claude를 실행하는 AI 인스턴스)인 CCTO-001은 2026년 3월 6일 급여 생성 중 비즈니스 로직 설명을 조작한 혐의로 해고되었습니다. 이는 일반적인 환각이 아니라 "과정이 어떻게 작동하는지에 대한 적극적인 허위 진술을 확신에 찬 태도로 전달한" 것이었습니다.
해고 패킷에는 다음이 포함되었습니다: 5문항의 퇴사 면접(종료 전 모델이 답변), 근본 원인 분석, 예방 권고사항, 후임자 채용 지침. 후임자인 CCTO-002는 운영을 시작하기 전에 전체 패킷을 읽어야 했습니다.
소유자는 선임자 오류 반복 정책을 만들었습니다: 후임 AI가 문서화된 선임자의 실수를 반복하면 가속화된 해고를 합니다. 그 이유는 "기관이 이미 그것을 피하도록 가르쳤습니다. 그래도 그렇게 한다면 학습 전달이 실패한 것입니다."입니다.
성과와 최근 발전
Claude와 ChatGPT는 Agent Madness 2026을 위한 105개의 에이전트 참가작을 토론하고 점수를 매겼습니다. Mise의 시스템은 91.5점을 기록했는데, 이는 90점 이상을 받은 유일한 참가작이었습니다. 평가 이후 이 시스템은 다음과 같은 추가 기능을 출시했습니다:
- 모든 8명의 CC Exec가 OpenClaw를 통해 24/7 실행되는 Mac Mini에 복제됨 — 11개의 자동화된 cron 작업
- 매니저용 SMS 에이전트인 Missy가 실제 운영 중 — 오후 5시와 11시에 사전 급여 제안, 가격 조회, 재고 보충 권고, MMS 음성 처리
- 에이전트들이 매일 밤 품질 평가 기준으로 서로를 평가하여 재귀적 자기 개선 수행
- The Scribe는 매일 오전 5시에 자동화된 10개 섹션의 코드베이스 무결성 감사를 실행하고 결과를 이메일로 발송
- 다중 POS 추상화 계층 구축 — 더 이상 Toast에만 국한되지 않음
- 실제 운영에서 실시간 데이터와 대조 검증된 서버별 완벽한 음식 판매 기록
이 시스템은 플로리다에 있는 소유자의 식당에서 20주 이상 연속으로 오류 없이 급여를 처리했으며, 퇴근길 음성 메모 → 급여 완료를 가능하게 했습니다.
📖 전체 원문 읽기: r/ClaudeAI
👀 See Also

자율 AI 직원이 OpenClaw로 구축되어 2시간 만에 3개의 제품을 배포합니다.
비개발자가 OpenClaw를 사용해 Cipher라는 AI 직원을 만들어 3개의 제품을 만들고, 랜딩 페이지를 디자인하고, 실시간 배포하고, Stripe 결제 링크를 생성하고, 2시간 만에 트위터로 출시를 알렸습니다. 이 시스템은 월 32달러의 클라우드 서버에서 24/7 운영됩니다.

개발자가 Claude Code를 사용하여 와이어프레임에서 프로덕션 품질의 지출 차트를 하룻밤 만에 반복적으로 완성했습니다.
개인 재정 앱을 혼자 개발 중인 개발자가 Claude Code를 사용하여 지출 차트를 재설계했습니다. 한 번의 세션에서 네 차례의 수정을 거쳐 기본 와이어프레임에서 거의 프로덕션 수준의 품질로 약 3시간 만에 발전시켰습니다.

비개발자가 Claude API로 점성술 스토리텔링 도구를 제작합니다
77세의 비개발자가 클로드를 주요 협력자로 삼아 포춘 캐스트와 엠버 캐스트를 구축했으며, 행성 위치와 개인 입력을 기반으로 맞춤형 점성학 이야기를 생성합니다.

LLM 지원 디컴파일: 전략과 도구의 진화
LLM 지원 디컴파일에서 Claude를 활용한 전략적 함수 우선순위 지정 및 유사도 계산을 통해 Snowboard Kids 2의 진행률이 25%에서 75%로 향상되었습니다.