RelayPlaneオープンソースプロキシ、Claudeモデルルーティングで73%のコスト削減を実現

Claude APIルーティングのためのオープンソースプロキシ
RelayPlaneは、Anthropic APIの前に配置されるオープンソースのnpmネイティブプロキシです。このツールはClaude Codeを使用して構築され、開発を加速させました。セルフホストは無料で、プロンプトの複雑度に基づいて異なるClaudeモデル間のルーティングを処理するように設計されています。
ベンチマーク結果と設定
ベンチマークでは、60%の単純タスクと40%の複雑タスクを含む混合ワークロードを使用しました。2つのシナリオを比較しました:
- 直接(すべてSonnet): p50レイテンシ 1.55秒、10リクエストあたりのコスト 0.0323ドル
- RelayPlane経由のルーティング: p50レイテンシ 0.78秒、10リクエストあたりのコスト 0.0086ドル
これは73.4%のコスト削減を表しています。1日あたり10,000リクエストの場合、これは月間約712ドルの節約に相当します。
ルーティング設定
ルーティング設定はシンプルです:
{
"routing": {
"complexity": {
"enabled": true,
"simple": "claude-haiku-4-5",
"moderate": "claude-sonnet-4-6",
"complex": "claude-opus-4-6"
}
}
}ルーティングロジックは、トークン数、コード指標、分析キーワードを調べる複雑度分類器を使用します。レスポンスヘッダーには、どのモデルが実際にリクエストを処理したかを確認するためのx-relayplane-routed-modelが含まれます。
モデル価格とルーティングロジック
ルーティングシステムは、複雑度に基づいてプロンプトを適切なモデルに振り分けます:
- 単純なプロンプト → Haiku(100万トークンあたり0.80ドル)
- 中程度のプロンプト → Sonnet(100万トークンあたり3ドル)
- 複雑なプロンプト → Opus(100万トークンあたり15ドル)
著者は、分類器は完璧ではないが「節約の大部分を捉えるには十分である」と述べています。完全なベンチマーク手法は、ソース資料にリンクされているGistで利用可能です。
📖 Read the full source: r/ClaudeAI
👀 See Also

pop-pay MCPサーバーは、Claude Codeエージェントに支払いガードレールを追加します。
pop-payは、クレジットカード番号を公開せずにClaude Codeエージェントが購入を処理できるようにするMCPサーバーです。CDPインジェクションを使用して仮想カードの認証情報を支払いiframeに直接配置し、Claudeはマスクされた確認番号のみを受け取ります。

個人用FastMCPサーバーのためのDrop-in OAuthプロバイダー、すべてのClaudeプラットフォーム対応
ある開発者が、Auth0やGoogleのような外部の認証サービスを必要とせずに、個人用のFastMCPサーバーをClaude.aiのWeb、モバイル、デスクトッププラットフォームで動作させるためのシングルファイルPython OAuthプロバイダーを作成しました。

n8n-mcp-lite:MCPサーバーにより、n8nワークフローでのClaudeのトークン使用量が80%削減されます
n8n-mcp-liteと呼ばれる新しいオープンソースのModel Context Protocolサーバーは、Claudeがn8n自動化ワークフローを推論するのを支援し、トークン使用量を約80%削減します。このツールは、視覚的ノード自動化のトークン消費量の多さに対処し、対象を絞ったワークフロースキャンと精密な更新を提供します。

オープンソースダッシュボードが明らかにするClaudeコードの実際のコンピューティングコスト
ある開発者がClaude Codeのレート制限の計算式をリバースエンジニアリングし、リアルタイムの使用率パーセンテージ、実際のドルコスト、バーンレート、ピーク時間、およびどのスキル/フックが発動しているかを表示するローカルダッシュボードを構築しました。このツールにより、月額100ドルのプランが1か月で13,286ドル相当のAPIコンピュートを消費していたことが明らかになりました。