RelayPlane 오픈소스 프록시, Claude 모델 라우팅으로 73% 비용 절감 효과 확인

✍️ OpenClawRadar📅 게시일: April 7, 2026🔗 Source
RelayPlane 오픈소스 프록시, Claude 모델 라우팅으로 73% 비용 절감 효과 확인
Ad

Claude API 라우팅을 위한 오픈 소스 프록시

RelayPlane은 Anthropic API 앞에 위치하는 오픈 소스 npm 네이티브 프록시입니다. 이 도구는 Claude Code를 사용하여 개발 속도를 가속화하며 구축되었습니다. 자체 호스팅이 무료이며, 프롬프트 복잡도에 따라 다양한 Claude 모델 간 라우팅을 처리하도록 설계되었습니다.

벤치마크 결과 및 구성

벤치마크는 60% 단순 작업과 40% 복잡 작업으로 구성된 혼합 워크로드를 사용했습니다. 두 가지 시나리오를 비교했습니다:

  • 직접 연결 (모두 Sonnet): p50 지연 시간 1.55초, 10회 요청당 비용 $0.0323
  • RelayPlane 라우팅 사용: p50 지연 시간 0.78초, 10회 요청당 비용 $0.0086

이는 73.4%의 비용 절감을 의미합니다. 하루 10,000회 요청 기준으로 약 $712의 월간 절감 효과로 이어집니다.

라우팅 구성

라우팅 구성은 간단합니다:

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

라우팅 로직은 토큰 수, 코드 표시자, 분석 키워드를 검사하는 복잡도 분류기를 사용합니다. 응답 헤더에는 실제로 요청을 처리한 모델을 확인할 수 있는 x-relayplane-routed-model이 포함됩니다.

Ad

모델 가격 및 라우팅 로직

라우팅 시스템은 복잡도에 따라 프롬프트를 적절한 모델로 전달합니다:

  • 단순 프롬프트 → Haiku (백만 토큰당 $0.80)
  • 중간 복잡도 프롬프트 → Sonnet (백만 토큰당 $3)
  • 복잡한 프롬프트 → Opus (백만 토큰당 $15)

저자는 분류기가 완벽하지는 않지만 "절감 효과의 대부분을 포착하기에 충분하다"고 언급했습니다. 전체 벤치마크 방법론은 소스 자료에 링크된 Gist에서 확인할 수 있습니다.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

클로드-퍼스트 애널리틱스 MCP 서버: AI 에이전트에 웹 애널리틱스 컨텍스트 직접 접근 권한 부여
Tools

클로드-퍼스트 애널리틱스 MCP 서버: AI 에이전트에 웹 애널리틱스 컨텍스트 직접 접근 권한 부여

한 개발자가 자신의 웹 분석 도구를 MCP 서버로 재구축하여, 간단한 웹 분석, 추적 가능한 링크, 제품 인사이트 도구를 Claude에 직접 제공함으로써 AI 에이전트가 코드 및 데이터베이스 컨텍스트와 함께 사이트 데이터를 활용할 수 있도록 했습니다.

OpenClawRadar
크리에이티브 엑설런스 플러그인, 클로드 코드가 상호작용 테제로 애니메이션 품질 향상
Tools

크리에이티브 엑설런스 플러그인, 클로드 코드가 상호작용 테제로 애니메이션 품질 향상

클로드 코드용 새로운 오픈소스 플러그인이 '상호작용 테제' 접근법을 구현하여 일반적인 애니메이션 생성 문제를 해결합니다. 이 접근법에서 클로드는 코딩 전에 동작 개념을 설명해야 합니다. 이 플러그인은 연구된 저장소에서 얻은 GSAP, Framer Motion, CSS 애니메이션 및 디자인 원칙을 다루는 8가지 하위 기술을 포함합니다.

OpenClawRadar
팽골린: ZTNA 대안으로서의 오픈소스 아이덴티티 기반 VPN
Tools

팽골린: ZTNA 대안으로서의 오픈소스 아이덴티티 기반 VPN

Pangolin은 신원 기반 원격 접근에 초점을 맞춘 오픈소스 VPN으로, Cloudflare ZTNA, Zscaler, Twingate에 대한 대안을 제공합니다.

OpenClawRadar
OpenClaw 길드: 팀을 위한 다중 사용자 AI 에이전트 서버
Tools

OpenClaw 길드: 팀을 위한 다중 사용자 AI 에이전트 서버

OpenClaw Guild는 단일 사용자용 OpenClaw를 다중 사용자 AI 서버로 확장하여 역할 기반 접근 제어, 에이전트별 데이터 격리, 4단계 메모리 시스템을 제공합니다. 웹 관리자 대시보드와 Docker-compose 배포를 포함하여 15분 내 설정이 가능합니다.

OpenClawRadar