모델 라우팅을 통해 OpenClaw 비용을 60% 절감한 방법

비용 분석 및 세부 내역
웹사이트 데이터 분석, 블로그 콘텐츠, 코드 리뷰, 고객 지원을 위한 네 개의 에이전트를 운영하던 OpenClaw 사용자는 20일 동안 $420($21/일)을 지출하고 있음을 발견했습니다. 모든 에이전트는 입력 토큰 100만 개당 $5, 출력 토큰 100만 개당 $25인 Claude Opus만 독점적으로 사용하도록 구성되어 있었습니다.
20일 동안 모든 에이전트의 13,500회 호출을 기록한 후 작업을 복잡도별로 분류했습니다:
- 70%는 단순 작업: FAQ 답변, 기본 포맷팅, 한 줄 요약, 사소한 PR 요약
- 16%는 표준 작업: 긴 이메일 초안, 중간 수준 코드 리뷰, 여러 단락 요약
- 9%는 복잡 작업: 심층 코드 분석, 장문 콘텐츠, 다중 파일 컨텍스트
- 6%는 실제 추론 필요: 아키텍처 결정, 복잡한 디버깅, 다단계 논리
분석 결과, 더 저렴한 모델로도 품질 저하 없이 처리할 수 있는 작업의 70%에 프리미엄 Opus 가격을 지불하고 있음이 밝혀졌습니다.
모델 가격 비교
사용자는 현재 모델 가격을 조사했습니다:
- Claude Opus 4.6: 입력 토큰 100만 개당 $5.00/출력 토큰 100만 개당 $25.00 (프리미엄)
- Claude Sonnet 4.6: 입력 토큰 100만 개당 $3.00/출력 토큰 100만 개당 $15.00 (중간 등급)
- Claude Haiku 4.5: 입력 토큰 20만 개당 $1.00/출력 토큰 20만 개당 $5.00 (예산형)
- GPT-5.4: 입력 토큰 105만 개당 $2.50/출력 토큰 105만 개당 $15.00 (프리미엄)
- Gemini 3.1 Pro: 입력 토큰 100만 개당 $2.00/출력 토큰 100만 개당 $12.00 (중간 등급)
- Gemini 3 Flash: 입력 토큰 100만 개당 $0.50/출력 토큰 100만 개당 $3.00 (예산형)
- GLM-5: 입력 토큰 20만 개당 $0.72–1.00/출력 토큰 20만 개당 $2.30–3.20 (예산형)
- Kimi K2.5: 입력 토큰 25.6만 개당 $0.60/출력 토큰 25.6만 개당 $3.00 (예산형)
- MiniMax M2.5: 입력 토큰 100만 개당 $0.30/출력 토큰 100만 개당 $1.20 (초예산형)
구현 및 결과
이제 진정으로 복잡한 작업에만 Opus를 실행합니다. 나머지 모든 작업은 Sonnet, Haiku, Kimi K2.5 또는 Qwen으로 라우팅됩니다. 각 작업 유형에 적합한 모델을 찾는 데 약 일주일이 걸렸습니다.
테스트에서 얻은 주요 발견 사항:
- Claude Haiku는 고객 지원에 가장 신뢰할 만했습니다: 빠른 응답, 포맷팅 지침을 잘 따름, 답변을 간결하게 유지
- Haiku는 명시적인 프롬프트가 필요합니다 - Opus처럼 모호한 지침에서 어조나 스타일을 추론하지 않습니다
- 답변 구조를 정확히 명시하도록 시스템 프롬프트를 재작성하여 Haiku를 지원 업무에 확실하게 사용할 수 있게 했습니다
- Kimi K2.5는 더 저렴하고 다중 턴 대화에 긴 컨텍스트를 잘 처리합니다
사용자들은 단순 작업에서 차이를 느끼지 못했고, 비용은 20일 동안 $420에서 $168로 떨어졌습니다.
📖 Read the full source: r/openclaw
👀 See Also

복사-붙여넣기에서 작업 공간 통합까지: AI 코딩 진화에 대한 개발자의 경험
한 개발자가 환각 라이브러리와 컨텍스트 관리 문제로 가득했던 초기 ChatGPT 코딩 시도에서, 파일을 직접 읽어 수동 컨텍스트 재구축이 필요 없는 Claude Code의 작업 공간 통합으로의 전환을 설명합니다.

클로드 오퍼스 4.6, 반복적 피드백을 통해 말볼지 코드 작성 성공
한 개발자가 Claude Opus 4.6을 사용하여 컴파일러 오류를 AI에 피드백으로 제공하는 루프를 구현함으로써 난해한 프로그래밍 언어인 Malbolge로 'Hello World'를 작성하는 데 성공했습니다.

마늘 농부, 안드로이드 폰에 1만 9천 줄 AI 에이전트 시스템 구축
한국의 마늘 농부가 안드로이드 폰의 Termux를 사용해 'garlic-agent'라는 19,260줄의 파이썬 AI 에이전트 시스템을 구축했습니다. 이 시스템은 여러 AI 제공자 간을 순환하며 SQLite에 컨텍스트를 저장하고, 개발에는 수동 복사-붙여넣기 워크플로를 사용합니다.

클로드가 한 세션에 구현한 스큐어모픽 키보드 시뮬레이터 — 공개 대화록, CORS 프록시된 언스플래시 배경
단일 Claude 세션으로 공개 전사, 기본 단축키 처리를 위한 숨겨진 입력, Figma의 SVG 키, CORS 프록시를 통해 WebP로 제공되는 Unsplash 배경을 갖춘 스큐어모픽 타이핑 앱이 제작되었습니다.