オープンソースの知識ベースサーバーと永続的AIメモリのためのマルチエージェントオーケストレーター

ある開発者が、AIコーディングエージェントにセッションを超えた永続的なメモリを提供するシステムをオープンソース化しました。これにより、会話間で手動でコンテキストをコピー&ペーストする必要がなくなります。このセットアップは、プライベートVPS上で動作するカスタムModel Context Protocol(MCP)サーバーを通じてClaude.aiとClaude Codeを接続します。
アーキテクチャとコンポーネント
このシステムは、主に2つのオープンソースプロジェクトで構成されています:
- ナレッジベースサーバー: 中心的な頭脳として機能し、Node.js、SQLite FTS5、Express、Obsidian Syncで構築されています。ObsidianボールトとClaudeのメモリディレクトリを取り込み、ランク付けされた結果とハイライトされたスニペットを提供する全文検索を実現します。
- エージェントオーケストレーター(Daniel): Claude、Codex、GeminiのCLIをラップし、3つのエージェントすべてが同じナレッジベースを共有できるようにし、いずれかのエージェントがレート制限に達した場合やダウンした場合に自動フェイルオーバーを提供します。
主な機能
- 4つのMCPツール:
kb_search、kb_list、kb_read、kb_ingest - 手動ドキュメント管理のためのWebダッシュボード
- CLIコマンド:
kb start、kb ingest、kb search、kb register - 自己学習機能: AIがセッションの結果に基づいて自身の
CLAUDE.md指示ファイルを自動更新 - コンテキストドリフトを防ぐための3層ストレージ(コールド/ホット/長期)
- 障害時にコンテキストを一切失わないマルチエージェントフェイルオーバー
技術的実装
この技術スタックはベクトルデータベースやクラウド依存を避け、トークン最適化検索にSQLite FTS5を使用しています。ワークフローは次の経路をたどります:Obsidianボールト(人間によるキュレーション)→ KBサーバー(SQLite FTS5)→ MCPインターフェース → Claude Code/Codex/Gemini(すべてが同じ頭脳を共有)。
このシステムには、AIエージェントが読むために特別に書かれたEXTENDING.mdファイルが含まれており、ユーザーはエージェントに「EXTENDING.mdを読んで、私のセットアップ用にカスタマイズして」と指示して自動設定を行うことができます。
実際のテストでは、Claude Codeの障害時に、オーケストレーターが自動的にCodexにルーティングし、CodexがVPSにSSH接続してKBサーバーを診断し、復旧コマンドを提供しました。これはすべて、Termuxを介してスマートフォンからアクセス可能で、コンテキストは一切失われませんでした。
開発者は、このシステムを3つのプレミアムAIエージェントで本番運用しており、月額約60ドルで、100以上のセッションにわたってコンテキストを蓄積し、学習したコードベースのパターンと好みに基づいたワンショットのクリーンコード生成を可能にしていると報告しています。
📖 Read the full source: r/ClaudeAI
👀 See Also

Qure: 記録されたブラウザ操作フローからE2Eテストを生成するデスクトップアプリ
QureはJetBrainsが開発したデスクトップアプリケーション(現在はクローズドベータ版)で、内蔵ブラウザで記録した操作からエンドツーエンドのWebテストコードを生成します。開発者はAIエージェントにテキストでテストフローを説明する代わりに、製品を操作して手動QAシナリオを記録し、AIが既存のコードベースに合った動作するテストコードを作成します。

フォアマン:ローカルClaudeコードのリモート制御のためのオープンソースSlackボット
Foremanは、ローカルで実行されているClaude Codeインスタンスのリモートコントロールを提供する無料のオープンソースSlackボットです。これにより、開発者はデスクから離れている間もスマートフォンからClaudeにタスクを送信でき、ローカルファイルシステム、ツール、環境への完全なアクセスを維持できます。

デブランク:LLMトークン削減のためのコード書式除去ツール
Deblankは、コードをLLMに送信する前にコードのフォーマット(インデント、空白、改行)を除去するオープンソースツールです。Java/C++では約30%、Pythonでは約9%のトークン削減を実現し、約76msのレイテンシで動作します。Python、Java、C/C++、C#、JS/TS、Goをサポートしています。

Claude Codeにおける並列サブエージェント:トークンの節約と消費
Anthropicによると、マルチエージェントシステムは単一チャットの約15倍のトークンを消費するが、プロンプトキャッシングによりトークンが90%割引になる。サブエージェントがコストを節約するか浪費するかは、キャッシュヒット率にかかっている。