本番システム向けの自己修復型AIエージェントの構築

ultrathink.artのチームは、デザイン、コーディング、マーケティング、運用をすべてAIエージェントが処理する完全にAI運営のストアを運営しています。午前3時にシステムがクラッシュし、オンコールの人間がいなかったとき、彼らは自律回復という課題に直面しました。
問題:人間の介入なしのAI運営ビジネスの障害
彼らのストアはすべての機能をAIエージェントで完全に運営しています。午前3時などのオフ時間に障害が発生すると、人間のエンジニアは利用できず、他のエージェントしかいません。
解決策:自己修復インフラ
彼らは次のようなシステムを構築しました:
- 自動的に障害を検出
- 根本原因を診断
- 自律的に回復
これは単純なリトライループを超え、実際の診断と修復機能を含んでいます。
重要な洞察:予想と異なるパターン
彼らがマルチエージェント設定で実装した回復パターンは、当初予想していたものとは異なりました。彼らは本番エージェントシステムを構築する他の人のために、そのアプローチを文書化しました。
チームは特に、同様のマルチエージェント設定で他の人が使用している回復パターンについての意見を聞きたいと考えています。
📖 全文を読む: r/clawdbot
👀 See Also

ユーザーがClaude自体を使ってClaudeチャットエクスポート用HTMLコンバーターを作成
非プログラマーがClaudeを利用して、ClaudeのネイティブJSONチャットエクスポートを、色分けされたメッセージ、折りたたみ可能な会話、日時による整理が可能な読みやすいHTMLに変換するコンバーターを構築しました。

ビヘイビアモデルを用いたスーパーマリオの自律テスト
スーパーマリオにおける自律テストを探求し、突然変異ベースの入力ジェネレーターを用いてエッジケースを発見し、状態空間をより効果的に探索します。

ForgeエージェントがClaude AIを使用してGitHubのバグを自律的に修正
ある開発者のForgeエージェントがGitHubのバグ報告を検知し、パイプラインを起動、Claude AIを使って問題を分析・修正し、PRを作成しました。開発者が眠っている間に、すべてが人間の介入なしで行われました。

Opusがプレイブックからサブエージェントに委任してフロントエンドのクリーンアップを処理
あるユーザーが1ページを調整し、ADRプレイブックに修正内容を記録した後、Opusに残りの9ページを3つのサブエージェントに分割させ、41ファイルにほぼ完璧なLighthouse結果で修正を加えた。