OpenClawに4層自己監査システム導入、Geminiが盲点を検出

OpenClawを6週間にわたり永続的なAIアシスタントとして運用している開発者は、繰り返し発生する問題を特定しました：Claudeが自身の行動をレビューすることで盲点が生まれ、「修正完了」と宣言しながらテストをせず、あるいは計画中の作業と実際に完了した作業を同じ確信度で説明するといったミスが繰り返されていました。

4層の監査システム

解決策は、モデルのトレーニングではなく行動の進化を目的とした4層システムです。重みは変わりませんが、以下の層を通じて操作指示がより賢くなります：

修正後の検証：修正＋テスト＋証明を1つの原子ステップとして行います。証拠なしに「修正済み」とはしません。
パターンマイニング：ミスログを読み取り、クラスター（同じエラーが2回以上＝システムの問題）を探す週次cronジョブ。
外部ミラーリング：セッションの要約をGeminiや他のLLMに、「このアシスタントの盲点を見つけてください」というプロンプトで送信します。異なるアーキテクチャは異なる盲点を生み出します。
期待値と現実の比較：昨日「修正済み」とされた項目が実際に修正されたままかどうかを確認する日次チェック。