OpenClawの3つの重大なギャップ：生産用AIエージェントに必要な監査可能性、アクション制御、指示解決

OpenClawの基盤と運用現場の現実

CRM、Slack、メール、データベースなどの実際のシステム向けにエージェントを構築してきたOpenClaw開発者は、デモエージェントと「真のAI従業員」を隔てる3つのギャップを指摘しています。情報源によると、OpenClawには自発性、記憶、実行という適切な基盤があるものの、これらのギャップが企業が重要なワークフローにエージェントを導入するのを妨げているとのことです。

1. 監査可能性

現在のOpenClawエージェントでは、アクションが実行され出力は見えますが、なぜそうなったのかの理解がありません。これは、例えばエージェントが5万ドルの見込み客にフォローアップを送信するような運用シナリオでは問題となります。開発者は、明確な監査証跡がなければ、失敗をデバッグしたり、エージェントの動作を改善したり、チームに決定を説明したり、より重要な業務をエージェントに任せたりできないと述べています。

情報源が指摘する必要な要素：

アクションログだけでなく、決定ログ
非エンジニアでもアクセス可能な推論のトレース
平易な言語で「なぜこれをしたの？」と問い合わせ可能な機能

2. アクションの詳細な制御

現在のほとんどのエージェントフレームワークは、完全な自律性か完全な手動承認のいずれかしか提供しておらず、どちらも運用現場では機能しません。開発者はこれを、実際の従業員が段階的な信頼のもとで働く方法と比較しています：最初は下書きのみの権限から始め、信頼性を証明するにつれて時間とともに自律性を獲得していくというものです。

情報源が指摘する必要な要素：

アクションレベルの権限（例：エージェントは下書き可能だが送信不可）
閾値ベースの制御（5千ドル以下は自動送信、5千ドル超は承認が必要）
エスカレーションルール（信頼度がX%未満の場合は人間に確認を求める）
時間経過に伴う権限の進化

3. 指示解決

矛盾する指示を与えられた場合、現在のOpenClawエージェントは、プロンプトの順序に基づいてランダムに1つを選択するか、両方を実行しようとして混乱を招くか、フリーズして何もしないかのいずれかです。開発者は、複数のチームメンバーがエージェントを設定すること、会社の方針が変わること、エッジケースが存在することから、運用現場では指示の矛盾は避けられないと指摘しています。

情報源が指摘する必要な要素：