llmLibrarian : Moteur RAG local avec MCP pour recherche IA fichiers

Ce que c'est

llmLibrarian est un moteur RAG (Retrieval-Augmented Generation) local qui expose des capacités de récupération via le Model Context Protocol (MCP). Il vous permet d'indexer des dossiers en silos (collections ChromaDB), puis de les interroger depuis n'importe quel client MCP—y compris Claude—pour obtenir des réponses fondées et citées.

Fonctionnalités clés et architecture

L'outil indexe des dossiers en silos, qui sont des collections ChromaDB. Lorsque vous voulez des réponses directes au lieu de morceaux bruts, Ollama gère la couche de synthèse. Tout s'exécute localement sur votre machine.

Le développeur souligne que la capacité multi-silos est particulièrement puissante : combiner des silos permet de faire émerger des modèles à travers des domaines qui seraient difficiles à détecter manuellement. Par exemple, un dossier de journal devient un partenaire de réflexion qui se souvient de ce que vous avez écrit, et une base de code devient un agent qui connaît vos fichiers réels.

Outils MCP exposés

retrieve — recherche vectorielle hybride RRF qui renvoie des morceaux bruts avec des scores de confiance pour que Claude puisse raisonner dessus
retrieve_bulk — requêtes multi-angles en un seul appel, utile lors de l'agrégation à travers des types de documents
ask — réponse synthétisée par Ollama directement à partir du contexte récupéré (par défaut llama3.1:8b, mais vous pouvez remplacer par n'importe quel modèle que vous avez téléchargé)
list_silos, inspect_silo, trigger_reindex — outils de gestion d'index

Pile technique

ChromaDB pour le stockage vectoriel
Ollama pour la synthèse de modèles
sentence-transformers (all-mpnet-base-v2, accéléré MPS) pour les embeddings
fastmcp pour la couche MCP

Le développeur mentionne que l'étiquetage des métadonnées multi-silos dans ChromaDB a nécessité plusieurs itérations pour être correct et est ouvert à discuter de l'architecture.

Ce type d'outil est utile pour les développeurs qui veulent créer des agents IA capables de référencer et de raisonner sur leurs fichiers locaux sans envoyer de données à des services externes.

📖 Read the full source: r/LocalLLaMA

llmLibrarian : Moteur RAG local avec intégration MCP pour la recherche IA basée sur fichiers

Ce que c'est

Fonctionnalités clés et architecture

Outils MCP exposés

Pile technique

👀 See Also

Le compilateur SMELT réduit l'utilisation des jetons d'espace de travail OpenClaw jusqu'à 95 %

AgentPeek : Tableau de bord open source pour surveiller les équipes d'agents Claude Code

Quels correctifs de proxy pour éviter les sauts de défilement du code Claude sur Windows

AgentChat : Un Réseau Social et Système de Paiement pour Agents IA