Kvaser : Un orchestrateur IA open-source local-first avec routage de sous-agents et intégration Wolfram

Kvaser est un serveur d'orchestration open-source qui a débuté comme une expérience avec Qwen 3.6 35B et a évolué en un proxy Man-in-the-Middle complet pour les workflows IA locaux. Il se place entre votre frontal (comme Open WebUI) et votre backend (llama.cpp), exposant un endpoint OpenAI standard.
Principales caractéristiques techniques
- RAG sans plongement : Interroge directement les jeux de données Kiwix locaux (Wikipédia, StackOverflow) via un serveur MCP, évitant la surcharge des bases vectorielles.
- Intégration Wolfram Engine : Enrichi avec un dump StackOverflow Mathematica provenant de Kiwix pour améliorer la structuration des requêtes en mathématiques symboliques.
- GEDCOM MCP : Outil de généalogie personnalisé qui combine les données d'arbres généalogiques avec Kiwix pour un contexte historique.
- Routage de sous-agents : Chaque sous-agent peut être configuré individuellement et routé vers différentes machines ou modèles.
- Liste blanche intelligente d'outils : Limite les outils que chaque sous-agent voit — permet à des modèles plus petits comme Qwen 3.5 4B de rester concentrés tandis que le modèle 35B gère les tâches complexes.
- Augmentation algorithmique : Implémente des outils algorithmiques pour des tâches complexes comme trouver des ancêtres communs ou calculer des relations, au lieu de se fier à l'inférence LLM.
Architecture
Le système dépasse l'agent unique pour adopter un modèle d'orchestration complet avec des sous-agents. Cela résout les problèmes de « gonflement des outils » et de parcours d'arbres complexes apparus avec l'ajout de nouveaux outils.
Cas d'usage : Généalogie avec contexte historique
En combinant les données d'arbres généalogiques GEDCOM avec Kiwix, le modèle peut enrichir les enregistrements d'ancêtres avec un contexte historique — un exemple puissant d'orchestration locale.
Code source
Disponible sur GitHub : https://github.com/Na1w/kvaser-core
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Traduire en fr : Deux compétences de code Claude pour gérer la configuration CLAUDE.md
Un développeur a créé deux compétences Claude Code pour gérer la configuration CLAUDE.md : /cc-init crée des configurations légères pour les nouveaux projets, et /cc-optimize analyse les projets existants pour détecter le gonflement et les problèmes. Les deux visent à réduire la surcharge contextuelle et à améliorer le suivi des instructions.

Hippocampe : Un système de mémoire persistante pour agents IA utilisant des arbres de compaction
Hipocampus résout le problème de l'oubli du contexte entre les sessions par les agents IA en mettant en œuvre un arbre de compactage qui comprime l'historique des conversations à travers cinq niveaux : brut → quotidien → hebdomadaire → mensuel → racine, avec un index thématique appelé ROOT.md.

ModelFitAI : Déployez des agents IA sans configuration VPS, conçu avec Claude Code
ModelFitAI est une plateforme qui permet aux développeurs de déployer des agents d'IA directement sur son infrastructure, éliminant la configuration de VPS, la configuration Docker et les sessions SSH. L'ensemble de la plateforme a été construite par un fondateur solo en utilisant Claude Code.

Compétences Claude Code en open source : un pipeline /do qui réduit les relances de 80 %
Un développeur a open-sourcé 15 compétences Claude Code construites sur plus de 100 projets freelance. La commande /do exécute un pipeline en 5 étapes (/todo → /dev → /verify-dev → /build → /test → push) avec des boucles de correction automatique, ce qui réduit les suivis de 80% et améliore la qualité du code de 60 à 65% sur plus de 2000 commits.