RelayPlane 오픈소스 프록시, Claude 모델 라우팅으로 73% 비용 절감 효과 확인

Claude API 라우팅을 위한 오픈 소스 프록시
RelayPlane은 Anthropic API 앞에 위치하는 오픈 소스 npm 네이티브 프록시입니다. 이 도구는 Claude Code를 사용하여 개발 속도를 가속화하며 구축되었습니다. 자체 호스팅이 무료이며, 프롬프트 복잡도에 따라 다양한 Claude 모델 간 라우팅을 처리하도록 설계되었습니다.
벤치마크 결과 및 구성
벤치마크는 60% 단순 작업과 40% 복잡 작업으로 구성된 혼합 워크로드를 사용했습니다. 두 가지 시나리오를 비교했습니다:
- 직접 연결 (모두 Sonnet): p50 지연 시간 1.55초, 10회 요청당 비용 $0.0323
- RelayPlane 라우팅 사용: p50 지연 시간 0.78초, 10회 요청당 비용 $0.0086
이는 73.4%의 비용 절감을 의미합니다. 하루 10,000회 요청 기준으로 약 $712의 월간 절감 효과로 이어집니다.
라우팅 구성
라우팅 구성은 간단합니다:
{
"routing": {
"complexity": {
"enabled": true,
"simple": "claude-haiku-4-5",
"moderate": "claude-sonnet-4-6",
"complex": "claude-opus-4-6"
}
}
}라우팅 로직은 토큰 수, 코드 표시자, 분석 키워드를 검사하는 복잡도 분류기를 사용합니다. 응답 헤더에는 실제로 요청을 처리한 모델을 확인할 수 있는 x-relayplane-routed-model이 포함됩니다.
모델 가격 및 라우팅 로직
라우팅 시스템은 복잡도에 따라 프롬프트를 적절한 모델로 전달합니다:
- 단순 프롬프트 → Haiku (백만 토큰당 $0.80)
- 중간 복잡도 프롬프트 → Sonnet (백만 토큰당 $3)
- 복잡한 프롬프트 → Opus (백만 토큰당 $15)
저자는 분류기가 완벽하지는 않지만 "절감 효과의 대부분을 포착하기에 충분하다"고 언급했습니다. 전체 벤치마크 방법론은 소스 자료에 링크된 Gist에서 확인할 수 있습니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

클로드-퍼스트 애널리틱스 MCP 서버: AI 에이전트에 웹 애널리틱스 컨텍스트 직접 접근 권한 부여
한 개발자가 자신의 웹 분석 도구를 MCP 서버로 재구축하여, 간단한 웹 분석, 추적 가능한 링크, 제품 인사이트 도구를 Claude에 직접 제공함으로써 AI 에이전트가 코드 및 데이터베이스 컨텍스트와 함께 사이트 데이터를 활용할 수 있도록 했습니다.

크리에이티브 엑설런스 플러그인, 클로드 코드가 상호작용 테제로 애니메이션 품질 향상
클로드 코드용 새로운 오픈소스 플러그인이 '상호작용 테제' 접근법을 구현하여 일반적인 애니메이션 생성 문제를 해결합니다. 이 접근법에서 클로드는 코딩 전에 동작 개념을 설명해야 합니다. 이 플러그인은 연구된 저장소에서 얻은 GSAP, Framer Motion, CSS 애니메이션 및 디자인 원칙을 다루는 8가지 하위 기술을 포함합니다.

팽골린: ZTNA 대안으로서의 오픈소스 아이덴티티 기반 VPN
Pangolin은 신원 기반 원격 접근에 초점을 맞춘 오픈소스 VPN으로, Cloudflare ZTNA, Zscaler, Twingate에 대한 대안을 제공합니다.

OpenClaw 길드: 팀을 위한 다중 사용자 AI 에이전트 서버
OpenClaw Guild는 단일 사용자용 OpenClaw를 다중 사용자 AI 서버로 확장하여 역할 기반 접근 제어, 에이전트별 데이터 격리, 4단계 메모리 시스템을 제공합니다. 웹 관리자 대시보드와 Docker-compose 배포를 포함하여 15분 내 설정이 가능합니다.