オープンソースのMCPメモリサーバー:知識グラフと学習機能を搭載

cuba-memorysというオープンソースのMCPサーバーは、単純なRAGやベクトルストアを超えて、AIエージェントに永続メモリを提供します。Rustで書かれており、PostgreSQL + pgvectorバックエンドを採用し、学習機能を備えた知識グラフアーキテクチャを実装しています。
アーキテクチャと機能
このシステムは、フラットな文書ではなく、エンティティ、観察、型付き関係を保存します。主な機能は以下の通りです:
- 指数関数的減衰 — 重要性 = 重要性 * exp(-0.693 * 日数/半減期) の式(半減期30日)を用いて、記憶が現実的に減衰します
- ヘブ学習 + BCMメタプラスチシティ — EMAスライディング閾値を用いたオジャのルール。記憶はアクセスによって強化され、BCMにより自己正規化されます
- 4信号RRF融合(k=60) — ts_rank + trigrams + pgvector HNSW + 重要性をエントロピー経由の重み付けで組み合わせ、キーワード中心クエリと意味的クエリを検出します
- ライデンコミュニティ検出 — Traag et al. 2019のアルゴリズムにより、知識グラフ内のクラスターを発見します
- パーソナライズドPageRank — グラフトポロジーに基づいてエンティティの重要性をランク付けします
- 反幻覚検証 — 保存された知識に対して主張を三角測量し、段階的な信頼度スコアリングを行います
- パターン検出を備えたエラーメモリ — 類似したエラーが3件以上発生した場合に警告をトリガーします
パフォーマンスベンチマーク
Rust実装は、元のPython版と比べて大幅な改善を示しています:
- バイナリサイズ: ~50MB venv(Python) vs 7.6MB(Rust)
- エンティティ作成: ~2ms(Python) vs 498μs(Rust)
- ハイブリッド検索: <5ms(Python) vs 2.52ms(Rust)
- メモリ使用量: ~120MB(Python) vs ~15MB(Rust)
- 依存関係: 12パッケージ(Python) vs 0ランタイム(Rust)
実装の詳細
このサーバーは13のMCPツールを提供し、Claude Code、Cursor、Windsurfを含むあらゆるMCP互換クライアントで動作します。PostgreSQLバックエンドでセルフホストされ、外部API呼び出しは行いません。すべてのアルゴリズムは査読付き論文に基づいており、READMEに引用があります。
インストールオプション:
pip install cuba-memorys
または
npm install -g cuba-memorys
このプロジェクトは、GitHubでCC BY-NC 4.0ライセンスの下で利用可能です。
📖 Read the full source: r/LocalLLaMA
👀 See Also

VSCodiumでローカルのOllamaモデルを使用するOpenAI Codex IDEの活用
OpenAI Codex IDEは、config.tomlファイル内の特定の設定を使用して、VSCodiumでローカルのOllamaモデルと連携するように設定できます。

wmux: MCP経由でブラウザ制御を備えたWindows用Electronターミナルマルチプレクサー
wmuxは、Windows 10/11向けのオープンソースElectronターミナルマルチプレクサーで、tmuxスタイルの分割、永続セッション、Claude CodeなどのAIコーディングエージェント向けのChrome DevTools Protocolによるブラウザ制御を提供します。自動的にMCPサーバーとして登録され、エージェントがブラウザと対話しながら複数のセッションを並行して実行できるようにします。

インディー開発者がClaude CodeでSteam APIデータ層を含むゲームスタジオサイト全体を展開
インディーゲーム開発者がClaude Codeを使用して、端末に触れることなくゲームスタジオのウェブサイトを構築・デプロイしました。Steam APIからライブ情報を取得するデータレイヤーも含まれています。

エージェントレンズ:マルチエージェントAIワークフロー向け可観測性ツール
AgentLensは、Ollama、vLLM、Anthropic、OpenAIにまたがる統一トレーシングを提供し、コスト追跡、Claude Codeから統計を照会するためのMCPサーバー、インライン確認のためのCLIを備えています。セルフホスト型で、Dockerを介してローカルで実行されます。