Chaîne de secours LLM multi-fournisseurs avec prise en charge Ollama dans l'IDE IA de production

Resonant Genesis, une plateforme IDE IA de production, a intégré le support des LLM locaux en tant que fournisseur de premier plan dans son architecture. La plateforme s'exécute sur plus de 30 microservices et traite les modèles locaux sur un pied d'égalité avec les fournisseurs cloud comme Groq, OpenAI, Anthropic et Gemini.
Architecture et intégration
La plateforme utilise une bibliothèque partagée rg_llm appelée UnifiedLLMClient qui est montée en volume sur tous les services. Chaque microservice nécessitant des capacités LLM importe ce même client. La chaîne de repli est configurée comme suit : Groq → OpenAI → Anthropic → Gemini → Ollama/LM Studio.
L'extension client léger de l'IDE découvre automatiquement les modèles Ollama locaux et les ajoute à la liste des fournisseurs. Les utilisateurs peuvent configurer le système pour privilégier d'abord les modèles locaux s'ils le souhaitent.
Orchestration côté serveur
Toute l'orchestration se fait côté serveur, l'IDE agissant comme un client léger qui affiche l'interface utilisateur, exécute les outils locaux (opérations sur fichiers, terminal, git) et diffuse les résultats via Server-Sent Events (SSE). La boucle agentique, la sélection d'outils, les invites système et le routage LLM se produisent tous sur le serveur.
Lors de l'utilisation d'un modèle local, il passe toujours par le même pipeline d'exécution régulé :
- Application des politiques pré-exécution (bloque les actions avant leur exécution)
- Appel de fonctions natif via les API des fournisseurs (pas d'injection JSON dans les invites)
- Identité cryptographique (DSID sur Ethereum L2) pour chaque agent
- Les mêmes 59 outils locaux disponibles quel que soit le fournisseur LLM choisi
Avantages pour les utilisateurs de LLM locaux
Pour les utilisateurs exécutant Ollama localement, cette architecture offre :
- Confidentialité : L'architecture client léger signifie qu'aucune intelligence d'entreprise n'est dans le binaire, et avec les modèles locaux, les invites restent locales
- Utilisation d'outils : 59 outils locaux avec appel de fonctions natif, pas de schémas JSON injectés dans les invites
- Repli : Si un modèle local ne peut pas gérer une tâche complexe, il bascule automatiquement vers les fournisseurs cloud
Les développeurs sollicitent les retours des personnes utilisant des modèles locaux, notamment concernant les performances d'appel de fonctions avec des modèles plus petits et quels modèles fonctionnent bien pour l'utilisation agentique d'outils.
Le projet est open source sur GitHub, et un chat invité démontrant l'écosystème d'outils est en ligne sur dev-swat.com (utilise des modèles cloud).
📖 Read the full source: r/LocalLLaMA
👀 See Also

Extension de Navigateur Coloriseur de Barre d'Utilisation Claude Construite avec Claude Code
Un développeur a créé une extension de navigateur qui recolore les barres d'utilisation de Claude du vert au jaune puis au rouge selon des seuils de pourcentage, ajoute une fenêtre contextuelle avec des données d'utilisation en direct, et permet la personnalisation des seuils et des couleurs. L'extension ne fonctionne que sur la page d'utilisation de Claude, stocke les paramètres localement et n'effectue aucune requête réseau externe.

Le plugin Open-source Claude Code capture les livres et les les convertit en Markdown structuré.
Un développeur a open-sourcé un plugin Claude Code qui capture automatiquement les pages de livres via des captures d'écran, effectue une OCR avec macOS Vision, et génère des fichiers Markdown structurés organisés par thème plutôt que par ordre des chapitres. L'outil prend en charge Kindle, Apple Books, Kindle Cloud Reader et les PDF scannés sur macOS.

Hubcap Bridge : Messagerie Bidirectionnelle Persistante entre CLI et JavaScript Navigateur via CDP
Hubcap Bridge est une nouvelle fonctionnalité de l'outil CLI Hubcap qui crée un canal de communication bidirectionnel persistant entre les processus locaux et le JavaScript exécuté dans les pages du navigateur via le Chrome DevTools Protocol. Il permet aux compétences Claude Code d'interagir avec les applications web via leurs API JavaScript internes sans nécessiter d'accès à une API publique.

Agent IA Crée Autonome une Vidéo en Utilisant Remotion Sans Outils Préétablis
Un développeur a testé un agent d'IA qui a créé de manière autonome un court montage vidéo en installant Remotion, en écrivant du code de composition, en déboguant des problèmes et en livrant un fichier rendu sans intervention humaine.