llmLibrarian:ファイルベースAI検索のためのMCP統合ローカルRAGエンジン

概要
llmLibrarianは、Model Context Protocol(MCP)を介して検索機能を公開するローカルRAG(Retrieval-Augmented Generation)エンジンです。フォルダをサイロ(ChromaDBコレクション)にインデックス化し、Claudeを含む任意のMCPクライアントからクエリを実行して、根拠のある引用付きの回答を得ることができます。
主な機能とアーキテクチャ
このツールはフォルダをサイロ(ChromaDBコレクション)にインデックス化します。生のチャンクではなく直接的な回答が必要な場合、Ollamaが合成レイヤーを処理します。すべてはローカルマシン上で実行されます。
開発者は、特に強力な機能としてマルチサイロ機能を強調しています:サイロを組み合わせることで、手動では捉えにくいドメイン横断的なパターンが浮かび上がります。例えば、ジャーナルフォルダはあなたが書いた内容を記憶する思考パートナーになり、コードベースは実際のファイルを知るエージェントになります。
公開されているMCPツール
retrieve— ハイブリッドRRFベクトル検索で、Claudeが推論するための信頼度スコア付き生チャンクを返しますretrieve_bulk— 1回の呼び出しで複数角度のクエリを実行、ドキュメントタイプを横断して集約する際に有用ask— 取得したコンテキストから直接Ollamaで合成された回答(デフォルトはllama3.1:8bですが、ダウンロード済みの任意のモデルに切り替え可能)list_silos、inspect_silo、trigger_reindex— インデックス管理ツール
技術スタック
- ベクトルストレージ:ChromaDB
- モデル合成:Ollama
- 埋め込み:sentence-transformers(all-mpnet-base-v2、MPSアクセラレーション対応)
- MCPレイヤー:fastmcp
開発者は、ChromaDBでのマルチサイロメタデータタグ付けには数回の試行錯誤が必要だったと述べており、アーキテクチャについての議論に開放的な姿勢を示しています。
この種のツールは、データを外部サービスに送信せずにローカルファイルを参照・推論できるAIエージェントを構築したい開発者にとって有用です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

HostMyClaudeHTML:Claude HTMLアーティファクトのワンクリック共有
開発者がhostmyclaudehtml.comを構築しました。これは、Claudeが生成したHTML成果物を.htmlファイルをドラッグ&ドロップするだけでライブURLとして共有できる無料ツールです。アップロード者も閲覧者もアカウントは必要ありません。

engram v3.4.0が新しいレート制限下でClaude Codeを稼働し続けるAnthropicプラグインを追加
engram v3.4.0は、Claude Code用の専用Anthropicプラグインを導入し、コスト管理、コンテキストのクエリ、エラーの表示という3つのスキルを追加しました。インストールは「/plugin install engram」または「npm install -g engramx@latest」で行います。

オープンソース手法によるClaudeとのエージェントAIパートナーシップ
開発者が、Claudeとの持続的パートナーシップシステム構築に関する25,000語の論文を公開し、セッション間で共有メモリ、認知モニタリング、複数AI相談機能を使用するオープンソーステンプレートをリリースしました。

onWatch: SQLiteストレージを備えたオープンソースのローカルAPIクォータトラッカー
onWatchは、ローカルファーストのAPI使用量トラッカーで、すべてのデータをローカルのSQLiteデータベースに保存し、クラウドサービス、テレメトリー、アカウント作成を必要としません。約13MBの単一バイナリで、バックグラウンドデーモンとして動作し、50MB未満のRAMを使用し、localhost上でダッシュボードを提供します。