벤치마크 결과: 메모리 시스템을 탑재한 클로드 에이전트 스웜, 토큰 비용 30-43% 절감 효과 확인

✍️ OpenClawRadar📅 게시일: March 8, 2026🔗 Source
벤치마크 결과: 메모리 시스템을 탑재한 클로드 에이전트 스웜, 토큰 비용 30-43% 절감 효과 확인
Ad

Claude 에이전트 스웜을 위한 메모리 시스템 벤치마크

한 개발자가 9개월 동안 파일 기반에서 SQLite, PostgreSQL로 발전시킨 Stompy라는 메모리 시스템을 구축해 왔습니다. 목표는 Claude 에이전트 스웜을 실행할 때 토큰 사용량을 최소화하는 것이었습니다. 그들은 메모리 시스템을 적용한 경우와 적용하지 않은 경우의 성능을 비교하는 벤치마크를 실시했습니다.

테스트 설정

벤치마크는 백엔드, 프론트엔드, 테스트를 포함한 완전한 예약 기능이 필요한 40점짜리 코딩 작업을 사용했습니다. 6개의 에이전트로 구성된 스웜을 Sonnet 4.6, Opus 4.6, Haiku 4.5 세 가지 다른 Claude 모델을 리더로 하여 테스트했습니다. 모든 테스트는 동일한 코드베이스, 동일한 팀원, 동일한 채점 시스템을 사용했습니다. 팀원 에이전트는 리더 모델과 관계없이 항상 Opus를 실행했습니다.

벤치마크 결과

  • Sonnet 4.6 + 메모리: 40/40, $3.98, 6.5분, 2턴
  • Sonnet 4.6 메모리 없음: 40/40, $7.04, 9.6분, 4턴
  • Opus 4.6 + 메모리: 40/40, $4.34, 9.6분, 29턴
  • Opus 4.6 메모리 없음: 40/40, $7.65, 10.0분, 70턴
  • Haiku 4.5 + 메모리: 39/40, $4.95, 7.5분, 2턴
  • Haiku 4.5 메모리 없음: 0/40, $3.97, 5.8분, 3턴
Ad

주요 발견 사항

메모리를 적용한 Opus와 Sonnet은 메모리를 적용하지 않은 경우에 비해 약 43%의 비용을 절감했습니다. 개발자는 이러한 모델들이 메모리 없이도 작업을 완료할 만큼 충분히 똑똑하지만, 메모리 시스템이 제거하는 코드베이스 탐색에 토큰을 낭비한다고 지적했습니다.

Haiku 결과는 예상치 못했습니다: 메모리 없이는 0/40점을 기록했지만, 메모리를 적용하면 39/40점을 기록했습니다. 개발자는 Haiku가 프로젝트 구조를 이해하지 못하면 Opus 팀원 에이전트들을 조율할 수 없지만, 메모리 접근 권한을 갖추면 유능한 리더가 된다고 관찰했습니다.

메모리를 적용한 Sonnet은 전반적으로 가장 우수한 구성이었으며, 모든 지표에서 메모리가 없는 Opus를 약 절반의 비용으로 능가했습니다. 결론은 비싼 모델을 사용하는 것보다 프로젝트 지식을 모델에 제공하는 것이 더 중요하다는 것입니다.

기술적 세부 사항

메모리 시스템은 Stompy라고 불리며 MCP/API/CLI 기반으로 Claude Code와 함께 작동합니다. 벤치마크 설정은 다른 사람들이 사용하거나 개선할 수 있도록 GitHub에서 이용 가능합니다. 개발자는 현재까지 조건당 n=1이므로 더 많은 실행을 계획하고 있다고 언급했습니다.

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

오프 그리드: 오프라인 AI 애플리케이션을 위한 휴대폰 하드웨어 활용
Tools

오프 그리드: 오프라인 AI 애플리케이션을 위한 휴대폰 하드웨어 활용

오프 그리드는 휴대폰의 하드웨어를 활용하여 텍스트 생성 및 음성 기록과 같은 오프라인 AI 작업을 수행하는 오픈 소스 앱입니다.

OpenClawRadar
로컬 미팅 녹음을 위한 OpenClaw 스킬과 Whisper
Tools

로컬 미팅 녹음을 위한 OpenClaw 스킬과 Whisper

ghostmeet이라는 새로운 OpenClaw 스킬이 Whisper를 사용하여 로컬 회의 녹취를 제공합니다. Chrome 확장 프로그램을 통해 브라우저 탭의 오디오를 캡처하며, Claude를 사용하여 요약을 생성할 수 있고, 모든 오디오와 녹취는 사용자의 기기에서 로컬로 처리됩니다.

OpenClawRadar
클로드 성장 스킬: AI 코딩 에이전트를 위한 체계적인 B2B SaaS 성장 플레이북
Tools

클로드 성장 스킬: AI 코딩 에이전트를 위한 체계적인 B2B SaaS 성장 플레이북

한 개발자가 5개의 SaaS 사례 연구, 9천만 달러 ARR 파트너십, 1,800건의 사용자 인터뷰를 바탕으로 6개의 검증된 플레이북을 포함한 Claude Growth Skill을 구축했습니다. 이는 PMF 검증부터 채널 생태계 및 영업까지 B2B SaaS 성장 작업을 구조화합니다.

OpenClawRadar
Chromeflow: Claude를 위한 웹 UI 작업 자동화 Chrome 확장 프로그램
Tools

Chromeflow: Claude를 위한 웹 UI 작업 자동화 Chrome 확장 프로그램

Chromeflow는 Claude Code로 구축된 무료 오픈소스 Chrome 확장 프로그램 및 MCP 서버로, Claude에게 브라우저 제어 기능을 제공하여 Stripe, Supabase, SendGrid 설정과 같은 수동 웹 UI 작업을 자동화합니다. 클릭할 요소를 강조 표시하고, 필드를 채우고, 저장 버튼을 클릭하며, API 키를 직접 .env 파일에 기록합니다.

OpenClawRadar