llmLibrarian : Moteur RAG local avec intégration MCP pour la recherche IA basée sur fichiers

Ce que c'est
llmLibrarian est un moteur RAG (Retrieval-Augmented Generation) local qui expose des capacités de récupération via le Model Context Protocol (MCP). Il vous permet d'indexer des dossiers en silos (collections ChromaDB), puis de les interroger depuis n'importe quel client MCP—y compris Claude—pour obtenir des réponses fondées et citées.
Fonctionnalités clés et architecture
L'outil indexe des dossiers en silos, qui sont des collections ChromaDB. Lorsque vous voulez des réponses directes au lieu de morceaux bruts, Ollama gère la couche de synthèse. Tout s'exécute localement sur votre machine.
Le développeur souligne que la capacité multi-silos est particulièrement puissante : combiner des silos permet de faire émerger des modèles à travers des domaines qui seraient difficiles à détecter manuellement. Par exemple, un dossier de journal devient un partenaire de réflexion qui se souvient de ce que vous avez écrit, et une base de code devient un agent qui connaît vos fichiers réels.
Outils MCP exposés
retrieve— recherche vectorielle hybride RRF qui renvoie des morceaux bruts avec des scores de confiance pour que Claude puisse raisonner dessusretrieve_bulk— requêtes multi-angles en un seul appel, utile lors de l'agrégation à travers des types de documentsask— réponse synthétisée par Ollama directement à partir du contexte récupéré (par défaut llama3.1:8b, mais vous pouvez remplacer par n'importe quel modèle que vous avez téléchargé)list_silos,inspect_silo,trigger_reindex— outils de gestion d'index
Pile technique
- ChromaDB pour le stockage vectoriel
- Ollama pour la synthèse de modèles
- sentence-transformers (all-mpnet-base-v2, accéléré MPS) pour les embeddings
- fastmcp pour la couche MCP
Le développeur mentionne que l'étiquetage des métadonnées multi-silos dans ChromaDB a nécessité plusieurs itérations pour être correct et est ouvert à discuter de l'architecture.
Ce type d'outil est utile pour les développeurs qui veulent créer des agents IA capables de référencer et de raisonner sur leurs fichiers locaux sans envoyer de données à des services externes.
📖 Read the full source: r/LocalLLaMA
👀 See Also

GLM-5.1 vs MiniMax M2.7 : Comparaison des performances pour les agents d'IA de codage
GLM-5.1 atteint des scores de 77,8 sur SWE-bench-Verified et 56,2 sur Terminal Bench 2.0, les plus élevés parmi les modèles open source, tandis que MiniMax M2.7 offre des réponses rapides avec un faible TTFT et un débit élevé, idéal pour les bots d'intégration continue et les modifications par lots.

Caliby : base de données vectorielle embarquée open-source pour agents IA avec stockage hybride texte+vecteurs
Caliby est une base de données vectorielle embarquée en C++ avec des liaisons Python (pip install caliby) qui prend en charge les index HNSW, DiskANN et IVF+PQ, revendique des performances 4 fois supérieures à pgvector, et stocke nativement le texte avec les vecteurs pour les cas d'utilisation d'agent IA/RAG.
Interface utilisateur et serveur pour les autoencodeurs en langage naturel d'Anthropic sur llama.cpp
Un serveur llama.cpp personnalisé et une interface Mikupad pour les autoencodeurs en langage naturel à poids ouverts d'Anthropic, prenant en charge l'extraction d'activations, l'explication, la reconstruction et le guidage par édition d'explications.

Agint : Un outil CLI en Rust qui détecte les contradictions dans les fichiers d'instructions des agents IA
Agint est un outil CLI Rust gratuit et open-source qui analyse les fichiers d'instructions comme CLAUDE.md et AGENTS.md à la recherche de contradictions, de références manquantes à des fichiers et de problèmes de synchronisation. Il utilise l'analyse statique pour les problèmes structurels et peut éventuellement appeler l'API Claude pour la détection de contradictions sémantiques.