Otterly : Acheminez OpenClaw via votre abonnement Claude Code

Otterly (package npm) est un outil léger qui expose votre CLI Claude local en tant que serveur HTTP compatible OpenAI sur localhost:11434. Tout outil qui parle l'API OpenAI Chat Completions — Cursor, Aider, Continue, OpenClaw, ou un simple curl — peut y pointer, et chaque requête est facturée à votre abonnement Claude Code existant plutôt qu'aux tarifs API par token.
Cela résout un problème spécifique : après le changement de politique du 4 avril d'Anthropic qui a coupé OpenClaw des abonnements Claude Code, les utilisateurs d'OpenClaw sur les forfaits Pro et Max ont été contraints de payer des tarifs API distincts par token pour un travail qui était auparavant couvert par l'abonnement. Le mécanisme de pool de crédits du SDK Agent s'épuise rapidement en cas d'utilisation soutenue. Un utilisateur exécutant plusieurs instances OpenClaw sur un Raspberry Pi chez lui a vu ses coûts grimper immédiatement après le changement.
Comment ça marche
Otterly exploite votre session authentifiée Claude Code. La première requête après une longue inactivité peut être lente pendant que la session se réauthentifie, mais les requêtes suivantes n'ajoutent qu'un surcoût d'environ 3 à 7 ms par rapport à l'API brute. La recette OpenClaw pour pointer vers le point de terminaison d'Otterly est documentée dans le README.
Limitations connues
- Partage les limites de débit de Claude Code : Si vous atteignez le plafond de 5 heures dans Claude Code, Otterly est indisponible jusqu'à la réinitialisation.
- Paramètres simulés : Certains paramètres spécifiques à OpenAI (
logit_bias,n>1,seed) ne sont pas implémentés. - Monoutilisateur uniquement : Fonctionne sur votre machine, pour votre abonnement. Ne l'exposez pas publiquement et ne revendez pas l'accès.
La FAQ sur le site d'Otterly est honnête sur ce que l'outil est et n'est pas, en particulier concernant l'auto-hébergement, l'utilisation en équipe et la conformité avec les conditions d'Anthropic.
📖 Lire la source complète : r/openclaw
👀 See Also

La recherche hybride avec RRF améliore le système de mémoire de l'IA par rapport à la recherche vectorielle pure.
Un système de mémoire IA open-source utilisant PostgreSQL avec pgvector a constaté que la recherche vectorielle pure était insuffisante pour les correspondances exactes, il a donc ajouté la recherche en texte intégral et fusionné les résultats en utilisant la Fusion de Rangs Réciproque (RRF) avec k=60, plus un enrichissement des requêtes via un tokenizer.

Opérateur Kubernetes OpenClaw avec prise en charge intégrée d'Ollama
Un membre de la communauté a créé un opérateur Kubernetes OpenClaw qui inclut un support Ollama intégré, permettant aux agents d'IA de fonctionner avec des modèles locaux dans le même espace de noms. La configuration comprend des commandes d'installation, des détails de configuration pour les modèles Ollama locaux et cloud, ainsi que des instructions d'accès au tableau de bord.

Routerly : Passerelle LLM auto-hébergée avec politiques de routage en temps réel et contrôle budgétaire
Routerly est une passerelle LLM gratuite, open-source et auto-hébergée qui offre une sélection de modèles en temps réel basée sur des politiques de routage comme le moins cher, le plus rapide ou le plus performant, ainsi que des limites budgétaires par projet avec suivi par token. Elle est compatible OpenAI pour une utilisation immédiate avec des outils comme Cursor, LangChain et Open WebUI.

Serveur MCP Ajoute une Mémoire Persistante avec Notation de Récupération à Claude Code
Un développeur a créé un serveur MCP appelé engram-mcp qui donne à Claude Code une mémoire persistante entre les sessions et les projets, avec un système de notation automatique des récupérations basé sur le succès des résultats et une détection de dérive pour les connaissances obsolètes.