RelayPlane Proxy Open Source Affiche une Réduction de Coût de 73 % avec l'Acheminement vers le Modèle Claude

✍️ OpenClawRadar📅 Publié: April 7, 2026🔗 Source
RelayPlane Proxy Open Source Affiche une Réduction de Coût de 73 % avec l'Acheminement vers le Modèle Claude
Ad

Proxy Open Source pour le Routage de l'API Claude

RelayPlane est un proxy open source natif npm qui se place devant l'API Anthropic. L'outil a été construit avec Claude Code, ce qui a accéléré le développement. Il est gratuit à auto-héberger et conçu pour gérer le routage entre différents modèles Claude en fonction de la complexité des prompts.

Résultats de Benchmark et Configuration

Le benchmark a utilisé une charge de travail mixte avec 60 % de tâches simples et 40 % de tâches complexes. Deux scénarios ont été comparés :

  • Direct (tout Sonnet) : latence p50 1,55 s, coût par 10 requêtes 0,0323 $
  • Via RelayPlane avec routage : latence p50 0,78 s, coût par 10 requêtes 0,0086 $

Cela représente une réduction de coût de 73,4 %. À 10 000 requêtes par jour, cela se traduit par environ 712 $ d'économies mensuelles.

Ad

Configuration de Routage

La configuration de routage est simple :

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

La logique de routage utilise un classificateur de complexité qui examine le nombre de tokens, les indicateurs de code et les mots-clés analytiques. Les en-têtes de réponse incluent x-relayplane-routed-model pour vérifier quel modèle a réellement traité la requête.

Tarification des Modèles et Logique de Routage

Le système de routage dirige les prompts vers les modèles appropriés en fonction de leur complexité :

  • Prompts simples → Haiku (0,80 $ par million de tokens)
  • Prompts modérés → Sonnet (3 $ par million de tokens)
  • Prompts complexes → Opus (15 $ par million de tokens)

L'auteur note que le classificateur n'est pas parfait mais est "suffisamment bon pour capturer la plupart des économies". La méthodologie complète du benchmark est disponible dans un Gist lié dans le matériel source.

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

GitVelocity : L'IA évalue 50 000 PR et révèle des informations sur la complexité du code
Tools

GitVelocity : L'IA évalue 50 000 PR et révèle des informations sur la complexité du code

GitVelocity utilise Claude pour évaluer les pull requests fusionnées sur une échelle de 0 à 100 selon six dimensions : portée, architecture, implémentation, risque, qualité et performance/sécurité. Après avoir analysé plus de 50 000 PR dans les langages TypeScript, Python, Rust, Go, Java et Elixir, l'équipe a découvert des tendances surprenantes concernant la taille des PR, la couverture des tests et l'adoption de l'IA.

OpenClawRadar
Quanta-SDK v0.9.2 ajoute un serveur MCP pour l'exécution de circuits quantiques via des agents IA.
Tools

Quanta-SDK v0.9.2 ajoute un serveur MCP pour l'exécution de circuits quantiques via des agents IA.

Quanta-SDK v0.9.2 inclut désormais un serveur MCP (Model Context Protocol) qui fournit aux agents IA comme Claude ou GPT des outils pour exécuter et interpréter des circuits quantiques. Le serveur propose plus de 20 outils incluant l'exécution de circuits sur du matériel IBM, l'interprétation des résultats, l'analyse du bruit et le tarif financier quantique.

OpenClawRadar
iai-mcp : Un démon local pour une mémoire OpenClaw persistante entre sessions
Tools

iai-mcp : Un démon local pour une mémoire OpenClaw persistante entre sessions

iai-mcp est un démon open-source qui capture toutes les conversations OpenClaw, les stocke dans trois niveaux de mémoire avec des plongements neuronaux locaux et un chiffrement AES-256, et réinjecte le contexte pertinent lors de nouvelles sessions — rappel textuel >99 %, récupération <100 ms, coût de démarrage de session <3k tokens.

OpenClawRadar
Claude Code Skill Convertit les Designs Stitch en Next.js sans Dérive de Pixel
Tools

Claude Code Skill Convertit les Designs Stitch en Next.js sans Dérive de Pixel

Une compétence Claude Code convertit les designs Google Stitch AI en composants Next.js avec des points de contrôle de vérification obligatoires pour éviter le décalage de pixels, préservant les valeurs exactes et gérant les ressources.

OpenClawRadar