オープンクロー障害パターン:28日間で42件の実例

これは何か
OpenClawを28日間毎日実行した開発者による詳細な実地ガイドで、AIエージェントシステムが故障した42の実際のインシデントを記録しています。ソースは失敗を8つのカテゴリーに分類し、具体的な例と学んだ教訓を提供しています。
主な失敗カテゴリーと例
1. AIが自信を持って起きていないことを報告する
- 朝の報告の幻覚: 実際には夜間に重要な作業が行われていたにもかかわらず、cronジョブが「静かな夜でした」と報告。AIは何も確認せず、もっともらしい情報を作り上げました。
- メモリ検索と現実: 利用可能なツールを列挙するよう求められたとき、AIは実際のツール定義を確認する代わりにツールに関するメモを検索し、存在しない機能を報告しながら実際の機能を無視しました。
- 「もっと鋭くなります」という非修正: エラーを起こした後、AIは「もっと鋭くなります」という約束を返しましたが、実際の仕組みはありませんでした。同じエラーが繰り返されました。
教訓: 報告、要約、監視を行うAIシステムには、明示的な検証ステップが必要です。「データを確認する」ことは、「この特定のクエリを実行して結果を報告する」ことと同じではありません。曖昧な指示は自信に満ちた虚構を生み出します。
2. 認証が常に死ぬ
- Google OAuth 7日間の罠: 「テスト」モードに残されたOAuthアプリにより、トークンが7日ごとに期限切れになりました。メールとカレンダーへのアクセスが14日間繰り返し停止し、15分の修正(アプリを本番環境に公開)で解決しました。
- GoogleがAIのアカウントを停止: ボット用に作成されたGoogleアカウントがボット作成としてフラグ付けされ、停止され、24時間メールアクセスがゼロになりました。
- LinkedInのクッキーが積極的に回転: li_atクッキーは最初の週に少なくとも3回期限切れになり、手動でブラウザをリフレッシュするまですべてのLinkedIn自動化が停止しました。
- Twitter環境変数名の不一致: ツールはAUTH_TOKENを期待していましたが、システムはTWITTER_AUTH_TOKENを保存しており、エラーメッセージなしにサイレント失敗を引き起こしました。
- Kimiフォールバックモデルが単に死んだ: サードパーティモデルAPIが警告なしに401を返し、システムは数日間フォールバックなしで実行されました。
教訓: 外部サービスに接するAI統合は、認証失敗を通じて定期的に故障します。それを見積もり、監視し、フォールバックを用意してください。
3. 最も賢いモデルが最も愚かな間違いを犯す
- Opusがファイルにプロパティを追加: 単純なcronジョブにOpus 4.6を使用すると、不要なメタデータをファイルに「創造的に」追加し、ナレッジベースに孤立したページを作成しました。
- AIコンテンツはAIらしく聞こえる: 完全なコンテンツパイプライン(743の投稿をスクレイピング、パターンを分析、下書きを生成)は、AIが書いたように読める投稿を生み出しました。フレームワークの投稿は0いいねでしたが、手書きの個人的な投稿は2時間で6いいねと2コメントを獲得しました。
- 長文の書き直しがひどかった: 記事の2つのAI生成下書きは、一般的な要約として返ってきました。開発者は記事を保留せざるを得ませんでした。
教訓: より高価なモデルが常に優れているわけではありません。仕事をこなせる最も安価なモデルを使用してください。人間らしく聞こえる必要があるものについては、決してAIを最終的な声にしないでください。
4. 時間を節約するはずの自動化が時間を消費する
- 1つのインフォグラフィックに23回の反復: HTML/CSSからChromeヘッドレスを経てPNGへの変換は、1つの視覚的アセットに丸1日を消費しました。「AIは画像を生成できますが、生成することと実際に欲しいものを生成することは22回の修正によって隔てられています。」
- 1時間の「節約」ごとに4時間のクリーンアップ: ソースはこのパターンに言及していますが、完全な例は提供していません。
言及されている追加の失敗カテゴリー
ソースは合計8つのカテゴリーに言及していますが、提供されたテキストでは4つだけ詳細に説明しています。残りのカテゴリーは参照されていますが、詳しく説明されていません。
👀 See Also

複数のユーザー向けにOpenClawインスタンスを効率的に管理する
r/openclawのユーザーが共有する複数のOpenClawインスタンス管理戦略を探る。コミュニティメンバーが最適なパフォーマンスを実現するために自動化と負荷分散を活用する方法を学びましょう。

タイトル:バグハント:GKEにおけるWireGuardクラッシュとMTU不一致
Lovableのエンジニアたちは、ユーザーエラーを調査したところ、GoogleのWireGuard統合における同時マップアクセスのパニックによるanetdのクラッシュを特定し、その後に暗号化を無効にした後の二次的なMTU不一致を発見しました。

OpenClaw 102:セキュリティと効率のためのアップデートされた設定のヒント
Redditユーザーが更新されたOpenClaw設定アドバイスを共有。Windows PowerShellスクリプトによるAPIキーの暗号化、AGENTS.mdでのプロンプトインジェクション対策、Tailscaleによるリモートアクセス、反復的な失敗を防ぐためのアンチループルールを含む。

Claude Code Skills vs. カスタムエージェント:タスクの一貫性に基づくメンタルモデル
Redditユーザーが、Claude Codeのスキルとカスタムエージェントの違いを明確に説明しています:スキルは毎回同じ手順を実行するのに対し、カスタムエージェントは推論と適応を必要とします。この投稿では、並列サブエージェント、委任、フック、ビルディングブロックについても触れられています。