ClawCodex/어드바이저 모드: 비용은 줄이고 품질은 유지하는 저가 작업자-고가 검토자 매칭

대부분의 에이전트 CLI는 단일 모델을 선택하도록 강제합니다. Opus는 훌륭한 결정을 내리지만 예산을 빠르게 소진하고, Haiku는 저렴하지만 중요한 아키텍처 판단을 놓칩니다. ClawCodex는 Claude Code의 오픈소스 Python 포트로, /advisor 모드를 통해 핵심 결정 지점에서 저렴한 워커 모델과 고가의 리뷰어 모델을 짝지어 이 문제를 해결합니다.
작동 방식
저렴한 워커(예: haiku-4-5, deepseek-v4-pro)는 파일 읽기, 편집, 테스트 실행 등 무거운 작업을 처리합니다. 결정 지점(해석 확정 전, 작업 완료 선언 전, 또는 막혔을 때)에서 워커는 중단하고 더 강력한 리뷰어(예: opus-4-7)와 상담합니다. 리뷰어는 전체 대화(모든 도구 호출, 모든 결과)를 확인하고 짧은 Gaps / Risks / Do-next 조언을 반환합니다. 그러면 워커가 계속 진행합니다.
두 가지 실행 모드
- 서버 측 (Anthropic 1P): 어드바이저 베타 헤더 사용 — 왕복 한 번, 프롬프트 캐시 친화적. 워커와 어드바이저 모두 Anthropic에서 실행됩니다.
- 클라이언트 측 (모든 제공자): 워커가 일반
tool_use를 내보내면 에이전트가 이를 가로채 구성된 어드바이저 모델에 별도 호출을 보냅니다. 왕복 두 번이지만 제공자를 혼합할 수 있습니다. 예: DeepSeek 워커 + Claude Opus 어드바이저, 또는 Gemini 워커 + GLM 어드바이저.
구성 및 모니터링
REPL에서 한 줄로 구성합니다:
/advisor anthropic:claude-opus-4-7
/advisor deepseek:deepseek-v4-pro
상태 표시줄에 워커 토큰, 어드바이저 토큰, USD 비용이 별도로 표시되어 지출 내역을 정확히 확인할 수 있습니다.
벤치마크 및 호환성
ClawCodex는 Anthropic, OpenAI, Gemini, DeepSeek, GLM, Minimax, OpenRouter를 기본 지원합니다. SWE-bench Verified에서 동일한 harness 기준 Gemini 2.5 Pro로 58.2%를 기록했으며, OpenClaude의 53%보다 높습니다.
까다로운 부분: 프롬프트
가장 까다로운 엔지니어링 과제는 리뷰어가 워커의 계획을 단순히 반복하지 않도록 하는 것이었습니다. 초기 버전에서는 그대로 반복되어 맥락이 낭비되었습니다. 해결책은 엄격한 '1인칭 금지, 반복 금지' 규칙과 Gaps / Risks / Do-next 템플릿을 결합하는 것이었습니다.
대상 사용자
모든 호출에 Opus 비용을 지불하지 않고도 Opus 수준의 아키텍처 판단력을 원하는 AI 코딩 에이전트 사용 개발자.
📖 전체 소스 읽기: r/openclaw
👀 See Also

로컬 LLM을 클로드 코드 서브에이전트로 사용하여 컨텍스트 사용량 줄이기
개발자가 Claude Code를 사용하여 LM Studio의 API를 통해 로컬 LLM에 작업을 위임하는 방법을 공유하며, 파일 내용을 Claude의 컨텍스트에서 제외합니다. 이 접근 방식은 로컬에서 파일을 읽고 요약을 반환하기 위해 도구 호출을 사용하는 약 120줄의 Python 스크립트를 활용합니다.

mcp-india-stack: 인도 금융 API용 오픈소스 MCP 서버
mcp-india-stack는 GSTIN 검증, IFSC 조회, PAN 검증을 포함한 7개의 인도 금융 및 정부 API 도구에 대한 네이티브 접근을 Claude에 제공하는 오픈소스 MCP 서버입니다. 인증이 필요 없으며, 오프라인 우선 방식으로 작동하고, pip install을 통해 사용할 수 있습니다.

스카이클로: 텔레그램 제어 기능이 탑재된 클라우드 VPS용 러스트 AI 에이전트 런타임
SkyClaw는 텔레그램을 유일한 인터페이스로 사용하는 클라우드 VPS 배포를 위해 설계된 6.9MB Rust 기반 AI 에이전트 런타임입니다. 셸 명령어 실행, 헤드리스 크롬을 통한 웹 브라우징, 파일 읽기/쓰기, URL 가져오기 및 다중 라운드 도구 체이닝을 수행합니다.

Arena AI 모델 ELO 기록, 시간에 따른 LLM 성능 저하 추적
주요 AI 연구소의 플래그십 모델 ELO 등급을 시각화한 실시간 대시보드로, 점진적인 성능 저하와 신규 릴리스 시 급격한 상승을 보여줍니다. 연구소별로 하나의 곡선을 동적으로 그리며, 가장 높은 등급의 모델을 추적합니다.