ハイブリッドRAG実装ガイド：OpenClaw、Ollama、nomic-embed-textでローカルAIメモリを構築

問題: 保存ではなく検索

開発者は数か月分の日々のメモリログをマークダウンファイルに保存していましたが、情報の保存には役立っても、再度見つけることは困難でした。エージェントが過去のコンテキストを必要とする際、lsを実行し、ファイルを一つずつ開き、トークンを消費し、時に関連情報を見逃すという状況に陥っていました。問題は、保存ではなく意味による検索にありました。

解決策: ローカル埋め込みによるハイブリッドRAG

開発者は、OpenClawでmemorySearchを有効にし、プロバイダーとしてOllama、ローカル埋め込みにnomic-embed-textを使用し、ハイブリッドモードで実行しました。ハイブリッドとは、70%のベクトル類似度（nomic-embed-textによるコサイン類似度）と30%のBM25キーワードマッチングを組み合わせたものです。ベクトルは意味的な近さを扱い、BM25は正確な名前、バージョン、IDを処理します。MMRは冗長な結果を削減し、時間経過による重み付けは最近のログにより大きな重みを与えます。すべては外部APIなしでローカルで実行されます。

設定

"memorySearch": {
  "provider": "ollama",
  "query": {
    "hybrid": {
      "enabled": true,
      "vectorWeight": 0.7,
      "textWeight": 0.3,
      "mmr": {
        "enabled": true,
        "lambda": 0.7
      },
      "temporalDecay": {
        "enabled": true,
        "halfLifeDays": 30
      }
    }
  }
}

セットアップ手順

OpenClawはlocalhost:11434でOllamaを自動検出します
baseUrlやモデルを指定する必要はありません - nomic-embed-textがプルされていれば自動的に使用します
まずollama pull nomic-embed-textを実行し、その後ゲートウェイを再起動します
provider: "openai"を設定してbaseUrlをOllamaに向けることは避け、直接provider: "ollama"を使用してください

必要な行動の変更

ツールを有効にするだけでは不十分でした。memorySearchを使用する明示的な指示なしに、エージェントはそれをスキップし、より遅くトークンを大量に消費するルートを取っていました。開発者は、ワークスペースのAGENTS.mdとMEMORY.mdの両方にルールを書き込み、メモリ検索をエージェントの通常のワークフローの一部としました。

導入前後の結果

導入前: フォルダを閲覧し、ファイルを無作為に開き、表現が一致することを期待し、トークンを浪費し、コンテキストを見逃す
導入後: 意味的なクエリでmemory_searchを実行し、類似度スコア付きのランク付けされた結果を取得し、最適なマッチを開き、実際の過去のノートから回答する
関連する結果の類似度スコアは、散文ログに対してnomic-embed-textでは通常0.45から0.48の範囲です

実用的な注意点

nomic-embed-textのデフォルトのコンテキスト制限は2048トークンであり、8192ではありません - 大きなファイルはインデックス作成時に切り詰められる可能性があります
スペイン語のメモリファイルも問題なく動作します - nomic-embed-textはスペイン語を問題なく処理します
検索品質はノートの品質に依存します - 曖昧なログは依然として意味検索の課題を引き起こします