ローカルMCPメモリシステムとAI会話のための統合

概要
ある開発者が、単に情報を保存するだけでなく、統合・合成するAI会話用のローカルメモリシステムを作成しました。MCPサーバーとして構築されており、Claude DesktopやClaude Codeなどの互換性のあるクライアントと連携し、データがハードウェアから流出することなく100%ローカルで動作します。
仕組み
標準的なRAGシステムとの主な違いは、統合プロセスにあります。6時間ごとに、ローカルLLM(LM Studioで実行されるQwen 2.5-7B)が最近のメモリをトピックごとにクラスタリングし、構造化された知識ドキュメントに統合します。事実、解決策、好みを抽出し、既存の知識と統合し、すべてをバージョン管理します。
技術スタック
- 埋め込み: LM Studio経由のnomic-embed-text-v1.5
- ベクトル検索: FAISS(意味的+キーワードハイブリッド)
- 統合LLM: LM Studio経由のQwen 2.5-7B(Q4)
- ストレージ: エピソード用にSQLite、ベクトル用にFAISS
- プロトコル: MCP — サポートするあらゆるものと連携
- 設定: TOML
機能
- コサイン類似度0.95閾値による意味的重複排除
- 適応的サプライズスコアリング — 頻繁にアクセスされるメモリは強化され、古いものは減衰
- クラッシュ保護のためのtempfile + os.replaceによるアトミック書き込み
- トゥームストンベースのFAISS削除 — インデックス全体を再構築する代わりにO(1)
- 優雅な劣化 — LM Studioがダウンしてもストレージは機能し、統合は一時停止
- 88個のテスト合格
MCPツール
memory_store— タイプ、タグ、サプライズスコア付きでエピソードを保存memory_recall— エピソードと統合された知識全体での意味的検索memory_forget— エピソードを削除対象としてマークmemory_correct— 知識ドキュメントを更新memory_export— 完全なJSONバックアップmemory_status— ヘルスチェック
MCPが選ばれた理由
モデルは頻繁に置き換えられますが、蓄積された知識はそれらと共に消えてはいけません。MCPはメモリをポータブルにします — 1つのストア、多くのインターフェース。メモリ層は、個々のモデルよりも価値あるものになります。
実用的な結果
約1週間の使用後、このシステムはPCハードウェア、VRセットアップ、コーディングの好み、プロジェクトアーキテクチャに関する知識ドキュメントを構築しました — すべて通常の会話から合成されたものです。新しいチャットを開始する際、AIはユーザーのコンテキストを再説明することなく既に把握しています。
要件
- Python 3.11以上
- Qwen 2.5-7Bとnomic-embed-text-v1.5が読み込まれたLM Studio
- 任意のMCPクライアント
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

mindpm: Claudeとの持続的なプロジェクトメモリのための無料MCPサーバー
mindpmは、ClaudeにローカルのSQLiteデータベースを提供して、会話全体でタスク、決定、メモ、セッションの要約を追跡する無料のオープンソースMCPサーバーです。セットアップは30秒で完了します。コマンド: claude mcp add mindpm -e MINDPM_DB_PATH=~/.mindpm/memory.db -- npx -y mindpm

ApexClaw:85以上のツールを備えたWeb自動化、音声、メール対応のオープンソースTelegram AIエージェント
ApexClawは、Goで書かれたオープンソースのTelegram AIエージェントで、ヘッドレスChromeによるウェブ閲覧、音声ノート処理、Gmail連携、シェルスクリプト実行など、85以上の組み込みツールを提供します。セルフホスト型で、推論にはz.aiエンジンを使用しています。

MCPサーバーがClaude Code/DesktopをApple Musicに接続 — プレイリスト、検索、プロフィール分析
新しいMCPサーバーにより、Claude CodeとClaude DesktopがApple Musicを制御可能に。プレイリストの一覧表示、曲の検索、プレイリストの作成、視聴パターンの分析を自然言語で行えます。

soul.pyは、シンプルなファイルベースのアプローチでローカルLLMに永続的なメモリを追加します。
soul.pyは、アイデンティティ情報と会話ログ用の2つのマークダウンファイルを使用して、Ollama、OpenAI、Anthropicモデルでデータベースやサーバーを必要とせずに、あらゆるLLMに永続的なメモリを追加するPythonライブラリです。