클로드 코드의 병렬 서브 에이전트: 토큰 절약과 소모의 순간

Anthropic의 수치는 종종 "하위 에이전트를 사용하라!"는 과대광고에서 무시됩니다: 멀티 에이전트 시스템은 단일 채팅보다 약 15배 더 많은 토큰을 소비하며, "코딩과 같이 긴밀하게 상호 의존적인 작업에는 덜 효과적"입니다(출처). 그러나 캐시된 토큰은 일반 10%의 비용(90% 할인)만 듭니다. 단, 캐싱 대상으로 지정된 콘텐츠가 요청 간에 동일한 경우에만 해당됩니다(출처).
멀티 에이전트는 토큰 사용량을 15배 늘립니다. 캐시는 이를 10으로 나눕니다. 하위 에이전트가 비용을 절약하거나 낭비하는지는 한 가지에 달려 있습니다: 모든 하위 에이전트가 동일한 프리픽스를 공유하는가?
비용 순으로 정렬된 세 가지 위임 방식
- 1.
subagent_type이 설정된 하위 에이전트. 사용자 정의 시스템 프롬프트, 사용자 정의 도구, 사용자 정의 권한(Anthropic). 프롬프트가 다르면 캐시도 다릅니다. 상위와 공유되지 않습니다. 생성할 때마다 전액 지불. 실제로 격리가 필요한 경우에 사용하세요. - 2. 상위를 상속하는 복제.
subagent_type없음. 상위의 프롬프트, 도구 및 기록을 정확히 상속합니다. 2번째 이후 자식은 10% 가격으로 캐시에 적중합니다. 5개의 복제가 파일을 병렬로 읽는 경우 ≈ 5배 속도에 약 1.5배 비용. - 3. 하위 에이전트 없음. 주 에이전트에 머무르기. 턴당 가장 저렴. 작업이 자체에 의존하는 경우 올바른 선택 — 2단계가 1단계의 결과를 필요로 하는 리팩토링.
위임하지 말아야 할 때 (Anthropic의 자체 기준)
"병렬 연구 스트랜드로 나눌 수 있는 작업에 가장 적합." 해석:
- 좋은 예: 7개 파일을 병렬로 읽기, 패턴에 대해 폴더 감사, 여러 소스에서 정보 수집.
- 나쁜 예: 모듈 리팩토링, 각 단계가 이전 단계에 의존하는 버그 수정. 주 에이전트만 사용.
긴밀하게 결합된 작업을 하위 에이전트로 나누면 15배를 지불하고 얻는 것은 없습니다.
캐시를 깨뜨리는 요소
Anthropic: 도구 정의 편집, 모델 전환, 이미지 추가 또는 제거, 이전 프롬프트 구조 변경은 캐시된 프리픽스를 깨뜨립니다(출처). 따라서:
- MCP는 세션 시작 시 설치하고 중간에 설치하지 마세요.
- 모델은 미리 선택하세요.
- 세션 중간에
CLAUDE.md나 자동 메모리를 편집하지 마세요. 이들은 캐시된 프리픽스 안에 있습니다.
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

Jentic Mini: 오픈클로를 위한 자체 호스팅 API 및 액션 실행 레이어
Jentic Mini는 AI 에이전트와 외부 API 사이에 위치하는 자체 호스팅 API 및 액션 실행 레이어로, 자격 증명을 암호화된 금고에 저장하고 개별적으로 취소 가능한 키로 범위가 지정된 툴킷을 제공합니다. 자격 증명이 추가되면 10,000개 이상의 OpenAPI 사양과 Arazzo 워크플로우 소스를 자동으로 가져옵니다.

Conduid.com은 23,000개 이상의 MCP 서버를 검색 가능한 디렉토리로 색인화합니다.
Conduid.com은 11개의 소스에서 MCP 서버를 수집하고 중복을 제거하며, GitHub 활동, 문서 품질, 유지 관리 신호를 기반으로 검색, 카테고리, 신뢰 점수를 제공합니다.

MCP 서버가 코드베이스를 지식 그래프로 인덱싱하여 토큰을 10배 감소시킵니다
codebase-memory-mcp라는 새로운 MCP 서버는 tree-sitter를 사용하여 코드베이스를 지속적인 지식 그래프로 파싱하여 구조적 쿼리에 대한 토큰 사용량을 최소 10배 감소시킵니다. 35개의 실제 저장소에서 벤치마킹한 결과, 파일별 탐색을 그래프 쿼리로 대체합니다.

Clawback: 누출된 Claude 검증 루프의 Hooks 기반 구현
Clawback는 Claude 소스 맵 유출에서 나온 검증 루프를 프롬프트 대신 기계적 훅으로 재구현한 GitHub 프로젝트입니다. 여기에는 컨텍스트 압박 하에서 모델이 건너뛸 수 없는 정지 훅, PreToolUse, PostToolUse, PostCompact 훅이 포함됩니다.