ローカルエージェントメモリのためのハイブリッドRAG:OpenClaw、Ollama、nomic-embed-textを活用

問題: 保存ではなく検索
開発者は数か月分の日々のメモリログをマークダウンファイルに保存していましたが、情報の保存には役立っても、再度見つけることは困難でした。エージェントが過去のコンテキストを必要とする際、lsを実行し、ファイルを一つずつ開き、トークンを消費し、時に関連情報を見逃すという状況に陥っていました。問題は、保存ではなく意味による検索にありました。
解決策: ローカル埋め込みによるハイブリッドRAG
開発者は、OpenClawでmemorySearchを有効にし、プロバイダーとしてOllama、ローカル埋め込みにnomic-embed-textを使用し、ハイブリッドモードで実行しました。ハイブリッドとは、70%のベクトル類似度(nomic-embed-textによるコサイン類似度)と30%のBM25キーワードマッチングを組み合わせたものです。ベクトルは意味的な近さを扱い、BM25は正確な名前、バージョン、IDを処理します。MMRは冗長な結果を削減し、時間経過による重み付けは最近のログにより大きな重みを与えます。すべては外部APIなしでローカルで実行されます。
設定
"memorySearch": {
"provider": "ollama",
"query": {
"hybrid": {
"enabled": true,
"vectorWeight": 0.7,
"textWeight": 0.3,
"mmr": {
"enabled": true,
"lambda": 0.7
},
"temporalDecay": {
"enabled": true,
"halfLifeDays": 30
}
}
}
}セットアップ手順
- OpenClawはlocalhost:11434でOllamaを自動検出します
- baseUrlやモデルを指定する必要はありません - nomic-embed-textがプルされていれば自動的に使用します
- まず
ollama pull nomic-embed-textを実行し、その後ゲートウェイを再起動します provider: "openai"を設定してbaseUrlをOllamaに向けることは避け、直接provider: "ollama"を使用してください
必要な行動の変更
ツールを有効にするだけでは不十分でした。memorySearchを使用する明示的な指示なしに、エージェントはそれをスキップし、より遅くトークンを大量に消費するルートを取っていました。開発者は、ワークスペースのAGENTS.mdとMEMORY.mdの両方にルールを書き込み、メモリ検索をエージェントの通常のワークフローの一部としました。
導入前後の結果
- 導入前: フォルダを閲覧し、ファイルを無作為に開き、表現が一致することを期待し、トークンを浪費し、コンテキストを見逃す
- 導入後: 意味的なクエリで
memory_searchを実行し、類似度スコア付きのランク付けされた結果を取得し、最適なマッチを開き、実際の過去のノートから回答する - 関連する結果の類似度スコアは、散文ログに対してnomic-embed-textでは通常0.45から0.48の範囲です
実用的な注意点
- nomic-embed-textのデフォルトのコンテキスト制限は2048トークンであり、8192ではありません - 大きなファイルはインデックス作成時に切り詰められる可能性があります
- スペイン語のメモリファイルも問題なく動作します - nomic-embed-textはスペイン語を問題なく処理します
- 検索品質はノートの品質に依存します - 曖昧なログは依然として意味検索の課題を引き起こします
技術スタック
- OpenClaw(ローカル、セルフホスト)
- Ollama + nomic-embed-text:latest
- SQLite with sqlite-vec and FTS5(OpenClawが初回使用時に自動的に作成)
- Mac mini M4, 16GB unified memory
📖 完全なソースを読む: r/openclaw
👀 See Also

開発者がプロジェクト管理とタスク追跡のためのClaudeセットアップの詳細を説明します
開発者が新しいWFHメディア職を管理するためのClaude実装を共有。マスターマークダウンプロジェクトファイル、Notion統合、Slack、Gmail、Google CalendarへのMCP接続、朝のブリーフィング用カスタムスキルを含む。

開発者はBDMAアプローチを用いてClaude Codeでフライト比較ツールを構築します
非開発者がClaude Codeを使用してBDMA(構築/デバッグ/測定/調整)ループアプローチでeasyscape.euを構築しました。このツールは複数の出発空港を比較し、道路料金や駐車場などの実コストを統合し、最安値のチケットだけでなく最も経済的な出発オプションを表示します。

製品アイデアの検証をClaude CodeとRemotionデモで実現
ある開発者が、本番コードを書く前にClaude CodeとRemotionを使ってTypeScript YouTube MCPツールの60秒コンセプトデモを構築し、合計約2時間を費やしました。このデモは、sqlite-vecを使用した50の講義にわたるセマンティック検索とAPIキー不要の要件を示すことで、アイデアを検証しました。

Claude エンジニアリングコンプライアンス向け:6ヶ月ワークフロー内訳
ある技術系企業が、ClaudeのProjects、Artifacts、制約遵守機能を活用して、顧客向け仕様書でのハルシネーションを回避する方法を紹介。