클로드 코드 병렬 서브 에이전트: 토큰 90% 절약법

좋은 예: 7개 파일을 병렬로 읽기, 패턴에 대해 폴더 감사, 여러 소스에서 정보 수집.
나쁜 예: 모듈 리팩토링, 각 단계가 이전 단계에 의존하는 버그 수정. 주 에이전트만 사용.

Anthropic의 수치는 종종 "하위 에이전트를 사용하라!"는 과대광고에서 무시됩니다: 멀티 에이전트 시스템은 단일 채팅보다 약 15배 더 많은 토큰을 소비하며, "코딩과 같이 긴밀하게 상호 의존적인 작업에는 덜 효과적"입니다(출처). 그러나 캐시된 토큰은 일반 10%의 비용(90% 할인)만 듭니다. 단, 캐싱 대상으로 지정된 콘텐츠가 요청 간에 동일한 경우에만 해당됩니다(출처).

멀티 에이전트는 토큰 사용량을 15배 늘립니다. 캐시는 이를 10으로 나눕니다. 하위 에이전트가 비용을 절약하거나 낭비하는지는 한 가지에 달려 있습니다: 모든 하위 에이전트가 동일한 프리픽스를 공유하는가?

비용 순으로 정렬된 세 가지 위임 방식

1. subagent_type이 설정된 하위 에이전트. 사용자 정의 시스템 프롬프트, 사용자 정의 도구, 사용자 정의 권한(Anthropic). 프롬프트가 다르면 캐시도 다릅니다. 상위와 공유되지 않습니다. 생성할 때마다 전액 지불. 실제로 격리가 필요한 경우에 사용하세요.
2. 상위를 상속하는 복제. subagent_type 없음. 상위의 프롬프트, 도구 및 기록을 정확히 상속합니다. 2번째 이후 자식은 10% 가격으로 캐시에 적중합니다. 5개의 복제가 파일을 병렬로 읽는 경우 ≈ 5배 속도에 약 1.5배 비용.
3. 하위 에이전트 없음. 주 에이전트에 머무르기. 턴당 가장 저렴. 작업이 자체에 의존하는 경우 올바른 선택 — 2단계가 1단계의 결과를 필요로 하는 리팩토링.