AIエージェントの精度を向上させるための4層ナレッジベースアーキテクチャ

r/openclawの開発者が、ツール、ワークフロー、ポリシーに関する具体的なコンテキストを提供することで、汎用LLMエージェントをドメインエキスパートにするための構造化ナレッジベースのアーキテクチャについて詳細に説明しました。
一般的なRAGアプローチの問題点
ソースでは、典型的なRAG実装におけるいくつかの問題点を指摘しています:クエリ分類がない(すべての質問が同じ検索パイプラインで処理される)、階層化がない(ガバナンス文書とブログ記事が同じように扱われる)、予算制限がない(エージェントのコンテキストウィンドウに無関係なチャンクが詰め込まれる)、自己修復機能がない(古くなった/壊れた文書が永遠にそのまま残る)。
4層のKBパイプライン
このシステムは4つの異なる層を使用しています:
- ガバナンス層 — 常に読み込まれます。エージェントのアイデンティティ、ポリシー、ルールを非交渉可能なコンテキストとして含みます。
- エージェント層 — エージェントごとのドキュメント。例えば、Lucyという名前の音声エージェントには通話処理ドキュメントが、Binky(CRO)というエージェントにはコンバージョンドキュメントが提供されます。
- 関連層 — タイトル/本文マッチングによるクエリごとの動的検索で、最大5文書、文書あたり12K文字の予算制限があります。
- Wiki層 — ファイルシステムブリッジを介して検索可能な200以上の参照記事で、AIの歴史、ツール定義、ワークフローパターン、プラットフォーム比較をカバーしています。
秘密兵器としてのクエリ分類
検索が行われる前に、正規表現ベースの分類器が質問に必要なコンテキスト量を決定します:
- DIRECT — 「このテキストを要約して」のようなタスクで、KBは不要です。
- SKILL_ONLY — 「ツイートを書いて」のようなタスクで、エージェントのスキルドキュメントだけで十分です。
- HOT_CACHE — 「請求処理は誰が担当していますか?」のような質問で、メモリキャッシュ内のガバナンスおよびエージェント文書から回答します。
- FULL_RAG — 「n8nとZapierの価格を比較して」のような複雑なクエリで、完全なベクトル検索とwikiブリッジが必要です。
この分類だけでトークンコストが約40%削減されたと報告されています。なぜなら、ほとんどの質問は完全なRAGを必要としないからです。
KBの構造と組織化
200以上の各記事は一貫したフォーマットに従っています:スコープが明確なタイトル、実践的な内容(表、コード例、意思決定フレームワーク)、実際のURLを含む2つ以上の引用ソース、5つの画像参照説明、2つの動画参照。
コンテンツは特定のドメインに組織化されています:
- AI/ML基礎(18記事) — 歴史、トランスフォーマー、埋め込み、エージェント
- ツーリング(16記事) — 定義、セキュリティ、分類法、エラー処理、監査
- ワークフロー(18記事) — 種類、プラットフォーム、コスト分析、HILパターン
- 画像生成(115ファイル) — 16のプロバイダー、比較、プロンプトフレームワーク
- 動画生成(109ファイル) — 処理方法、パイプライン、プラットフォームガイド
- サポート(60記事) — カスタマーヘルプセンターコンテンツ
自己修復システム
このアーキテクチャには、KBの健全性を0-100スケールで評価し、問題を自動的に解決する評価システムが含まれています:欠落した埋め込みは再埋め込みをトリガーし、古いコンテンツは更新のためにフラグが立てられ、壊れた参照は修復または削除されます。健全性スコアは、最初の修復パス後に71から89に改善されたと報告されています。
結果と主な要点
KB実装前は、エージェントはツール定義をでっち上げ、価格を作り出し、一般的なワークフローアドバイスを提供していました。実装後は、エージェントは特定の文書を引用し、実際の価格を含む正確なプラットフォーム比較を提供し、「それに関する最新データを持っていません」と言うべき時を知っています。
実装からの主な要点:
- 検索前に分類する — すべての質問にRAGは必要ありません。
- コンテキストウィンドウに予算を設定する — 合計60K文字、文書ごとの厳格な上限。
- 構造は量に勝る — 200のよく組織化された記事は、10,000のランダムなチャンクよりも優れています。
- 自己修復は必須 — ナレッジベースは劣化するので、初日から監視を構築します。
- 人間ではなくエージェントのために書く — 段落よりも表を優先し、散文よりも意思決定フレームワークを優先し、抽象的な説明よりも具体的な例を優先します。
📖 Read the full source: r/openclaw
👀 See Also

Cloudflare Dynamic Worker Loader: AIエージェントをアイソレートでサンドボックス化
CloudflareのDynamic Worker Loader APIは、現在オープンベータ版で、V8 isolateを使用した隔離されたサンドボックス内で、ランタイム指定のコードで新しいWorkerをインスタンス化できるようにします。コンテナと比べて100倍高速な起動を実現し、グローバルな同時実行制限はありません。

オープンクローエージェント向けローカルTrelloスタイルプロジェクトマネージャー
ある開発者が、OpenClaw AIエージェントと共に使用するために、Trelloの機能を模倣したローカルプロジェクト管理ツールを作成しました。このシステムは、クライアントのプロジェクトデータに関するセキュリティ上の懸念から、AIエージェントを外部サービスに接続しないように特に構築されました。

開発者が現実的なリレーショナルデータベース生成ツールを構築
開発者が、外部キー関係とテーブル間の整合性が保たれたテストデータベースを作成する問題を解決する、現実的なデータを備えた完全なリレーショナルデータベースを生成するツールを構築しました。

TigrimOS v1.1.0とTiger CoWork v0.5.0がリリースされ、リモートエージェントスウォームと構成可能なガバナンス機能を搭載しました。
本日リリースされたTigrimOS v1.1.0とTiger CoWork v0.5.0は、リモートインスタンス間のスウォーム間通信と5つの設定可能なガバナンスプロトコルを追加しました。両方ともセルフホスト型で、無料かつオープンソースです。