클로드 API 트래픽 라우팅으로 Max 구독 변경 후 비용 통제하기

API 청구 전환과 비용 영향
태평양 표준시 정오 기준으로, Anthropic의 Max 구독이 더 이상 OpenClaw와 같은 타사 도구의 사용을 포함하지 않습니다. 모든 OpenClaw 사용자는 이제 다음과 같은 요금으로 API 청구를 사용합니다:
- Claude Opus 4.6: 입력 100만 토큰당 $5, 출력 100만 토큰당 $25
- Claude Sonnet 4.6: 입력 100만 토큰당 $3, 출력 100만 토큰당 $15
- Claude Haiku 4.5: 입력 100만 토큰당 $1, 출력 100만 토큰당 $5
Opus에서의 무거운 OpenClaw 세션은 $1-4의 비용이 들 수 있는 반면, 대부분의 작업에서 유사한 결과를 내는 Sonnet에서의 동일한 세션은 $0.20-0.80의 비용이 듭니다.
라우팅 솔루션
대부분의 OpenClaw 작업은 Opus가 필요하지 않습니다: 하트비트 확인, 파일 읽기, 요약, 라우팅 결정, 짧은 도구 호출은 모두 Sonnet으로 처리할 수 있습니다. 라우팅 계층 없이는 모든 요청이 기본 모델에 도달하여 간단한 작업에 Opus 예산을 낭비할 수 있습니다.
로컬 프록시는 복잡도에 따라 Claude 요청을 라우팅합니다: 간단한 작업은 자동으로 Sonnet으로, 복잡한 작업은 Opus로 에스컬레이션됩니다. 이 접근 방식은 중요한 작업의 품질 손실 없이 비용을 크게 줄였습니다.
프록시는 오픈 소스이며 npm을 통해 설치할 수 있습니다: npm install -g @relayplane/proxy
자세한 문서와 논의는 r/ClaudeCode에서 확인할 수 있으며, 해당 솔루션은 52K 조회수를 기록했습니다.
📖 Read the full source: r/openclaw
👀 See Also

RUNE 프로토콜: 플랫폼 간 AI 세션 메모리 저장
RUNE(Relational User Notation for Entities)는 AI 관계 전체를 암호화된 .rune 파일로 저장하는 오픈소스 프로토콜로, AI 어시스턴트가 세션 간에 사용자를 잊어버리는 콜드 스타트 문제를 해결합니다. Claude Opus 4.6으로 제작되었으며 Claude와 GPT 플랫폼에서 모두 작동합니다.

Wisepanel MCP 서버는 Claude Code와 Cursor에서 다중 LLM 심의를 가능하게 합니다.
Wisepanel이 Claude Code, Cursor 또는 모든 MCP 클라이언트에서 직접 다중 에이전트 심의를 실행하는 MCP 서버를 출시했습니다. 이 서버는 ChatGPT, Claude, Gemini, Perplexity 모델을 활용하는 발산적 컨텍스트 강화 시스템을 사용합니다.

클로드 코드로 구축된 클로드 사용량 표시줄 색상 변경 브라우저 확장 프로그램
한 개발자가 사용량 백분율 임계값에 따라 Claude의 사용량 막대를 녹색에서 노란색, 빨간색으로 재색칠하고, 실시간 사용량 데이터 팝업을 추가하며, 임계값과 색상을 사용자 정의할 수 있는 브라우저 확장 프로그램을 만들었습니다. 이 확장 프로그램은 Claude의 사용량 페이지에서만 실행되며, 설정을 로컬에 저장하고 외부 네트워크 요청을 하지 않습니다.

코드베이스에서 지속적인 AI 에이전트 메모리를 위한 순회 가능한 스킬 그래프
개발자가 코드베이스 내부에 존재하는 3계층 스킬 그래프 시스템을 구축하여 AI 코딩 어시스턴트가 세션 간 지속적인 메모리를 유지할 수 있도록 했습니다. 이 시스템은 단일한 컨텍스트 파일 대신 자기 주도적 지침과 함께 점진적 공개 방식을 사용합니다.