RelayPlaneオープンソースプロキシ、Claudeモデルルーティングで73%のコスト削減を実現

✍️ OpenClawRadar📅 公開日: April 7, 2026🔗 Source
RelayPlaneオープンソースプロキシ、Claudeモデルルーティングで73%のコスト削減を実現
Ad

Claude APIルーティングのためのオープンソースプロキシ

RelayPlaneは、Anthropic APIの前に配置されるオープンソースのnpmネイティブプロキシです。このツールはClaude Codeを使用して構築され、開発を加速させました。セルフホストは無料で、プロンプトの複雑度に基づいて異なるClaudeモデル間のルーティングを処理するように設計されています。

ベンチマーク結果と設定

ベンチマークでは、60%の単純タスクと40%の複雑タスクを含む混合ワークロードを使用しました。2つのシナリオを比較しました:

  • 直接(すべてSonnet): p50レイテンシ 1.55秒、10リクエストあたりのコスト 0.0323ドル
  • RelayPlane経由のルーティング: p50レイテンシ 0.78秒、10リクエストあたりのコスト 0.0086ドル

これは73.4%のコスト削減を表しています。1日あたり10,000リクエストの場合、これは月間約712ドルの節約に相当します。

ルーティング設定

ルーティング設定はシンプルです:

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

ルーティングロジックは、トークン数、コード指標、分析キーワードを調べる複雑度分類器を使用します。レスポンスヘッダーには、どのモデルが実際にリクエストを処理したかを確認するためのx-relayplane-routed-modelが含まれます。

Ad

モデル価格とルーティングロジック

ルーティングシステムは、複雑度に基づいてプロンプトを適切なモデルに振り分けます:

  • 単純なプロンプト → Haiku(100万トークンあたり0.80ドル)
  • 中程度のプロンプト → Sonnet(100万トークンあたり3ドル)
  • 複雑なプロンプト → Opus(100万トークンあたり15ドル)

著者は、分類器は完璧ではないが「節約の大部分を捉えるには十分である」と述べています。完全なベンチマーク手法は、ソース資料にリンクされているGistで利用可能です。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

pop-pay MCPサーバーは、Claude Codeエージェントに支払いガードレールを追加します。
Tools

pop-pay MCPサーバーは、Claude Codeエージェントに支払いガードレールを追加します。

pop-payは、クレジットカード番号を公開せずにClaude Codeエージェントが購入を処理できるようにするMCPサーバーです。CDPインジェクションを使用して仮想カードの認証情報を支払いiframeに直接配置し、Claudeはマスクされた確認番号のみを受け取ります。

OpenClawRadar
個人用FastMCPサーバーのためのDrop-in OAuthプロバイダー、すべてのClaudeプラットフォーム対応
Tools

個人用FastMCPサーバーのためのDrop-in OAuthプロバイダー、すべてのClaudeプラットフォーム対応

ある開発者が、Auth0やGoogleのような外部の認証サービスを必要とせずに、個人用のFastMCPサーバーをClaude.aiのWeb、モバイル、デスクトッププラットフォームで動作させるためのシングルファイルPython OAuthプロバイダーを作成しました。

OpenClawRadar
n8n-mcp-lite:MCPサーバーにより、n8nワークフローでのClaudeのトークン使用量が80%削減されます
Tools

n8n-mcp-lite:MCPサーバーにより、n8nワークフローでのClaudeのトークン使用量が80%削減されます

n8n-mcp-liteと呼ばれる新しいオープンソースのModel Context Protocolサーバーは、Claudeがn8n自動化ワークフローを推論するのを支援し、トークン使用量を約80%削減します。このツールは、視覚的ノード自動化のトークン消費量の多さに対処し、対象を絞ったワークフロースキャンと精密な更新を提供します。

OpenClawRadar
オープンソースダッシュボードが明らかにするClaudeコードの実際のコンピューティングコスト
Tools

オープンソースダッシュボードが明らかにするClaudeコードの実際のコンピューティングコスト

ある開発者がClaude Codeのレート制限の計算式をリバースエンジニアリングし、リアルタイムの使用率パーセンテージ、実際のドルコスト、バーンレート、ピーク時間、およびどのスキル/フックが発動しているかを表示するローカルダッシュボードを構築しました。このツールにより、月額100ドルのプランが1か月で13,286ドル相当のAPIコンピュートを消費していたことが明らかになりました。

OpenClawRadar