クロード用永続メモリ:MCPによるローカルスタック、39msの検索、82%のトークン削減

✍️ OpenClawRadar📅 公開日: May 8, 2026🔗 Source
クロード用永続メモリ:MCPによるローカルスタック、39msの検索、82%のトークン削減
Ad

RedditユーザーがClaude用のローカル永続メモリレイヤーを構築し、セッション間のゼロコンテキスト問題を解決しました。スタックは完全にローカルで動作し(クラウド不要、APIキー不要)、MCPを介して統合されます。主要なアーキテクチャ:4つのレイヤー(L0: SQLiteの追記専用イベントログ、L1: 遅延された構造化事実、L2/L3: Wiki形式の散文、L4: 要約+決定事項+未解決スレッドを含む結晶化セッションノード)、ベクター検索用のQdrant Docker、GPU上のQwen3-Embedding-4BとCPU上のQwen3.5-2B-Q4_K_Mによる埋め込みとチャット用のllama.cpp、および7つのツール(retrievecrystallize_sessionlist_sessionsget_l4_nodeindex_statusreindexshutdown_models)を公開するFastMCPサーバー。

数値

  • grep+Readベースラインと比較したトークン削減率:平均82.7%、中央値86.2%。
  • 検索F1:0.50 vs ベースライン0.20。
  • 埋め込みコールドスタート約4秒、ホットパスp95 39ms(バグ修正前は2241ms)。
  • L4セッション検索評価:平均スコア0.920(閾値0.6)。
  • 104個のマークダウンファイルから738チャンクをインデックス登録。
Ad

主な学び:Windowsでの接続再利用

4070 Ti Super上のGPU常駐埋め込みでも、ホットパス検索がp95で2241msに停滞していました。原因は、httpx.post()呼び出しのたびに新しいTCP接続が開かれ、Windowsのlocalhostハンドシェイクに約2秒かかることでした。持続的なhttpx.Client(キープアライブ)に切り替えることで、p95が39msに低下——57倍の高速化。

その他の驚き

  • Qwen3思考モード: llama-serverで--jinjaを使用する際に、chat_template_kwargs: {enable_thinking: false}enable_thinkingを無効にしないと、モデルが全トークンバジェットを思考ブロックに使い、空のコンテンツを出力します。
  • MCP登録: Claude Desktopのエージェントモード(Cowork)は、~/.claude.jsonではなくプラグイン設定ファイルを読み取ります。LKSサービスは、適切なCowork .pluginバンドルとしてパッケージ化する必要があります。

対象ユーザー

Claudeを多用し、クラウド依存なしにコスト効率が高くプライベートなローカルメモリレイヤーでセッション間のコンテキストを維持したい開発者。

📖 全文を読む: r/ClaudeAI

Ad

👀 See Also

OpenClawのatoshipスキルは、AIアシスタントを配送マネージャーに変えます。
Tools

OpenClawのatoshipスキルは、AIアシスタントを配送マネージャーに変えます。

OpenClawのatoshipスキルにより、ユーザーは配送ニーズを平易な英語で説明でき、その後、運送会社の選択、料金比較、ラベル購入、追跡を処理します。例として、「この1ポンドの箱をニューヨークへ、最も安いオプションで送ってください」といったコマンドがあります。

OpenClawRadar
cortex-engine MCPサーバーは、永続メモリとマルチエージェントサポートを追加します
Tools

cortex-engine MCPサーバーは、永続メモリとマルチエージェントサポートを追加します

cortex-engine v0.4.0は、AIエージェントに永続的な長期記憶を提供するオープンソースのMCPサーバーです。observe()、query()、believe()、dream()などのツールを備えており、複数のエージェントを分離されたメモリ名前空間でサポートするようになりました。

OpenClawRadar
AI機能:自動検証によるランタイムコード生成
Tools

AI機能:自動検証によるランタイムコード生成

AI Functionsは、実装コードの代わりに自然言語の仕様で関数を定義できるPythonライブラリです。実行時にLLMが生成したコードを実行し、失敗時に自動再試行をトリガーする事後条件で出力を検証します。

OpenClawRadar
開発者が18のEコマースツールをClaudeに接続するMCPサーバーを構築
Tools

開発者が18のEコマースツールをClaudeに接続するMCPサーバーを構築

ある開発者が、18のEコマースプラットフォームとツールをClaudeと統合するMCPサーバーを作成し、複数のデータソースを横断したクエリを可能にしました。このプロジェクトは主にClaude Code(Opus)を使用して、数ヶ月ではなく数日で構築されました。

OpenClawRadar