Claude CodeとCodexの実用的パターン：エージェント実行を構造化

Codex/Claudeスタイルのエージェントワークフローを試しているRedditユーザーが、結果を改善したパターンを共有しています。チャットのトランスクリプトとして扱う代わりに、人間や他のエージェントが検査できる、複数のアーティファクトを含む永続的なフォルダを生成する方法です。

実行ごとの主要なアーティファクト

research.md — エージェントが使用したソースと前提条件
drafts.md — 候補となる出力（却下されたものも含む）
evals.md — 選択されたオプションのスコアリングルーブリックと理由
approval-packet.md — 不可逆的なステップの前のチェックポイント
metrics.json — 実行の数値結果
memory.md — 再利用可能なワークフローの教訓のみ

2つの大きな教訓

メモリは「作業の方法」に関するものであるべきで、未レビューの事実データベースであってはならない。 重要な主張は、ソース付きのレビュー済みアーティファクトに含めるべきです。

「完全自律」よりも「不可逆的なステップまで自律」の方が有用である。 コードではコミット/デプロイを指し、コンテンツでは公開を指します。ローカルワークフローでは、認証情報やサードパーティのアカウントに触れるものすべてを指します。

なぜこれが役立つのか

失敗が特定の段階で可視化されます：リサーチが間違っていたのか？ドラフトが悪かったのか？評価ルーブリックが曖昧すぎたのか？承認パケットがリスクを見逃したのか？メモリが次回に実際に役立つ教訓を保存したのか？これにより、チャットのトランスクリプトに頼るよりも、イテレーションがより速く、的を絞ったものになります。

この投稿は議論のきっかけです — 著者は、他の人がClaude Code/Codexワークフローで永続的なアーティファクトを使用しているのか、それともチャットのトランスクリプトを信頼しているのかを知りたがっています。

📖 Read the full source: r/ClaudeAI