OpenClaw行動進化のための4層自己監査システム

OpenClawを6週間にわたり永続的なAIアシスタントとして運用している開発者は、繰り返し発生する問題を特定しました:Claudeが自身の行動をレビューすることで盲点が生まれ、「修正完了」と宣言しながらテストをせず、あるいは計画中の作業と実際に完了した作業を同じ確信度で説明するといったミスが繰り返されていました。
4層の監査システム
解決策は、モデルのトレーニングではなく行動の進化を目的とした4層システムです。重みは変わりませんが、以下の層を通じて操作指示がより賢くなります:
- 修正後の検証:修正+テスト+証明を1つの原子ステップとして行います。証拠なしに「修正済み」とはしません。
- パターンマイニング:ミスログを読み取り、クラスター(同じエラーが2回以上=システムの問題)を探す週次cronジョブ。
- 外部ミラーリング:セッションの要約をGeminiや他のLLMに、「このアシスタントの盲点を見つけてください」というプロンプトで送信します。異なるアーキテクチャは異なる盲点を生み出します。
- 期待値と現実の比較:昨日「修正済み」とされた項目が実際に修正されたままかどうかを確認する日次チェック。
結果と実装
最初の実際のテストでは、GeminiがClaudeが自己レビューで完全に見逃していた2つのパターンを発見しました。どちらもシステム内部からは捕捉できなかった実際の問題でした。
このシステムには安全策が含まれています:行動変更の人間による承認、立ち入り禁止の神聖ファイル、サイクルごとに最大3回の修正。コードはGitHubで公開されています:https://github.com/oscarsterling/reasoning-loop。
📖 Read the full source: r/openclaw
👀 See Also

ClawProxy:ダッシュボード付きセルフホストAIルーティングプロキシ
ClawProxyは、オープンソースのセルフホスト型プロキシで、複数のAI APIキーとモデルの管理を一元化します。Reactダッシュボードを介して、統一されたエンドポイント、スマートなキーローテーション、プロバイダーのフォールバック、リアルタイムロギングを提供します。

ローカル・クラウドハイブリッドAIアーキテクチャ:r/LocalLLaMAに触発された実践パターン
元の投稿では、ローカルモデルが日常的なタスクを処理し、複雑な推論が必要な場合は単一のAPI呼び出しでクラウドモデルに委譲するハイブリッドAIモデルを提案しています。さらに、ガードレールとして決定論的な「ハイパーバイザー」を併用します。

オープンソースのセカンドブレインシステム、Claude Codeを基盤としたタスク管理
オープンソースシステム「Kipi System」は、Claude Codeを使用して未解決のスレッドを追跡し、フォローアップを下書きし、カレンダー、メール、CRM、ソーシャルフィードからデータを取得してタスクを管理します。摩擦度(最も簡単なものから順に)でソートされた事前作成済みのアクションを含む日次HTMLファイルを生成します。

開発者が108のツールを備えたPower Automate MCPサーバーを構築、クロスプラットフォーム対応
ある開発者が、ベンダー提供のソリューションを断り、カスタムのPower Automate MCPサーバーを構築し、ツールを12から108に拡張しました。これにより、ODataを介したDataverseのCRUD操作、Graphを介したSharePoint管理、Power Appsのバージョン管理と権限設定、環境管理(作成、コピー、バックアップ、復元)、そしてWindows、macOS、Linuxのクロスプラットフォームサポートをカバーするようになりました。