MCP를 통해 기계적 작업을 DeepSeek V4 Flash에 오프로드하여 Claude 비용 60배 절감

한 Reddit 사용자가 자신의 Claude 사용 내역을 분석한 결과, 대부분이 기계적인 작업에 사용되고 있음을 발견했습니다: 파일 분류, JSON 재포맷, 텍스트에서 필드 추출, 대충 훑어볼 문서 요약 등이었습니다. 이런 작업에 Sonnet이 필요하지 않았습니다. 해결책은 MCP를 통해 사이드 워커로 실행되는 작고 저렴한 모델과 CLAUDE.md에 해당 작업을 수행하지 말라고 지시하는 단일 규칙을 추가하는 것이었습니다.
설정: MCP 도구 + CLAUDE.md 거부 목록
설정은 텍스트를 보내고 텍스트를 받는 단일 MCP 도구를 사용합니다. 기본 모델은 DeepSeek V4 Flash(저렴, 100만 토큰 컨텍스트)입니다. 엔드포인트는 한 줄의 설정으로, OpenAI 호환 공급자(로컬 ollama, vllm, lm studio)와 작동합니다. 저장소는 github.com/arizen-dev/deepseek-mcp (MIT, Python 3.10 이상)입니다.
핵심 요소: CLAUDE.md 규칙은 부정적 프레이밍을 사용합니다 — 허용 목록이 아닌 거부 목록입니다. 사용자는 긍정적 프레이밍("X에는 DeepSeek 사용")이 약 30%의 경우 무시되었다고 보고합니다. 거부 목록 접근 방식은 확실하게 작동합니다.
# CLAUDE.md:
# Claude를 사용하지 마세요:
# - json 포맷팅
# - 필드 추출
# - 파일 분류
# - 검토할 요약
결과: 비용 60배 감소
3주간의 실제 사용 결과: 217개의 기계적 호출이 DeepSeek V4 Flash로 오프로드되어 총 비용 $0.41. 동일한 작업을 Sonnet으로 처리했다면 약 $7이었을 것입니다. 이는 해당 작업만으로 약 17배 차이이며, 사용자는 여전히 Sonnet을 사용하는 더 복잡한 작업을 고려할 때 전체 비용이 60배 감소했다고 말합니다.
사이드 워커 작동 방식
사이드 워커는 감독형 도구로, 에이전트가 아닙니다 — 도구 호출, 파일 접근, 체인 없음. 지연 시간은 3~25초입니다. 출력을 검토합니다. 전체 형태는 텍스트를 보내고, 텍스트를 받고, 검토하고, 계속 진행합니다.
대상
복잡한 작업에는 Sonnet의 추론 능력을 유지하면서 대량의 기계적 작업 비용을 줄이려는 Claude API 또는 Claude Code 사용자.
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

VPS vs 전용 서버: OpenClaw를 어디서 실행할까?
없음

커뮤니티 소스에서 수집한 OpenClaw 리소스 목록
GitHub 저장소가 설정, 구성, 메모리 시스템, 보안, 기술, 모델 호환성 및 커뮤니티 링크를 다루는 실용적인 OpenClaw 리소스를 수집하여 개발자들이 일반적인 정보 격차를 피할 수 있도록 돕습니다.

안정적인 설정을 위한 세 가지 필수 OpenClaw 기술: 메모리, 보안, 탐색
레딧 게시물에서는 세 가지 특정 유형의 OpenClaw 스킬을 먼저 설치할 것을 권장합니다: 컨텍스트 손실을 방지하는 메모리 수정 스킬, 악성 코드를 확인하는 로컬 보안 검증 스킬, 그리고 유지 관리되는 도구를 찾기 위한 큐레이션된 발견 허브입니다.

Windows 11 Home에서 Claude Cowork '작업 공간 시작 실패' 오류 해결하기
사용자가 Microsoft Store에서 Windows Subsystem for Linux(WSL2)를 설치하여 Claude Cowork의 Windows 11 Home 시작 오류를 해결했습니다. 이는 기본 VM 기술에 필요한 구성 요소입니다.