Décharger le travail de routine de Claude Code vers Gemma via le serveur offload-mcp MCP

✍️ OpenClawRadar📅 Publié: May 6, 2026🔗 Source
Décharger le travail de routine de Claude Code vers Gemma via le serveur offload-mcp MCP
Ad

L'outil offload-mcp est un serveur MCP conçu pour permettre à Claude de déléguer des tâches courantes à des API de modèles gratuites, en utilisant notamment Gemma via l'API Google GenAI. L'objectif est d'éviter de gaspiller le contexte coûteux de Claude Code ou Codex sur de petites tâches et de contourner les limitations de performance des modèles locaux exécutés sur du matériel comme un MacBook Air.

Détails clés

  • Gère : messages de commit, résumés de PR, traductions, docstrings, résumés de diff/fichiers sources, et invites libres.
  • Mode libre : envoyez presque n'importe quelle invite courante à un modèle moins cher au lieu d'utiliser Claude.
  • Mode source : lit les diffs/fichiers locaux directement via le serveur MCP et indique le nombre estimé de tokens d'entrée économisés.
  • La chaîne de modèles par défaut utilise Gemma, mais les identifiants de modèle sont configurables.
  • Dépôt : https://github.com/peterhadorn/offload-mcp

L'auteur note qu'il n'a pas trouvé d'autre outil sur GitHub pour gérer cela, et que le chemin d'API est bien plus pratique pour les petits travaux que l'exécution locale.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Biais Logit Toroïdal : Une Astuce Simple au Moment de l'Inférence Réduit les Hallucinations de 40 %
Tools

Biais Logit Toroïdal : Une Astuce Simple au Moment de l'Inférence Réduit les Hallucinations de 40 %

Une nouvelle méthode projette les tokens sur un tore et amplifie les logits voisins, réduisant les erreurs factuelles sans fine-tuning ni RAG.

OpenClaw Radar
Traduction en français : Modifications du flux de travail Claude Code UltraPlan et observations sur les performances
Tools

Traduction en français : Modifications du flux de travail Claude Code UltraPlan et observations sur les performances

Claude Code UltraPlan introduit un flux de travail de planification basé sur le cloud avec lancement depuis le terminal, interface de révision dans le navigateur et options d'exécution. Les tests ont montré des exécutions répétées environ 2 fois plus rapides que la planification locale, avec des améliorations de qualité variables.

OpenClawRadar
Claude Sleuth : Un flux de travail d'investigation en 56 tâches pour Claude AI
Tools

Claude Sleuth : Un flux de travail d'investigation en 56 tâches pour Claude AI

Claude Sleuth est un flux de travail d'investigation structuré pour Claude AI avec 6 phases et 56 tâches, incluant un stockage d'état persistant via Cloudflare D1 et des conventions de sortie standardisées comprenant des horodatages ISO 8601, des enregistrements d'entités POLE et le langage de probabilité ICD 203.

OpenClawRadar
Historique ELO du modèle Arena AI suit la dégradation des performances des LLM au fil du temps
Tools

Historique ELO du modèle Arena AI suit la dégradation des performances des LLM au fil du temps

Un tableau de bord en direct visualise les classements ELO des modèles phares des grands laboratoires d'IA, révélant une dégradation graduelle des performances et des sauts soudains lors des nouvelles versions. L'outil trace dynamiquement une courbe par laboratoire, en suivant le modèle le mieux noté.

OpenClawRadar