コーディングエージェントのセッションログを連合学習で活用する方法

Claude CodeやCodex CLIなどのコーディングエージェントをエージェントモードで使用すると、詳細なセッションデータがローカルマシンに記録されます。これらのログには、初期タスク、モデルの推論プロセス、実行されたすべてのツール呼び出し、環境からの応答、発生したエラー、再試行の試みなど、完全なインタラクションループが記録されます。これにより、強化学習研究者が必要とする正確なデータ形式である完全な（状態→行動→報酬→次の状態）タプルが作成されます。

ログの内容

ソースの著者が自身のマシンを確認したところ、以下のような結果が見つかりました：

Mac Mini: ~/.claude/projects/ に574回のエージェントセッションから1103ファイル、合計3.1GB
MacBook: ~/.codex/sessions/ に79回のエージェントセッションから3530ファイル、合計2.4GB
MacBook: ~/.claude/projects/ に99回のエージェントセッションから316ファイル、合計652MB

合計で、実際のツール呼び出しを含む775セッション、約4100万トークンが確認されました。数千人の開発者に外挿すると、これは数千億トークン規模の実際のエージェント軌跡データを表す可能性があります。このようなデータには現在、The Pileデータセットのようなオープンな同等物が存在しません。

このデータの重要性

環境は明確なフィードバック信号を提供します：終了コード0か否か、テストが合格か否か。これにより、因果推論、エラー回復、長期的な計画など、現在のモデルが苦手とする分野で不足していたトレーニング信号が得られます。大手AI研究所はすでに独自モデルのトレーニングのために内部でこのデータを収集していますが、データが個々の開発者のマシンに分散しているため、オープンな同等物は存在しません。

提案：連合学習

この投稿では、データがマシンから離れることのない連合学習の使用を提案しています。ローカルで小さなLoRAアダプターをトレーニングし、差分プライバシーノイズを加えた重みのみを共有し、改善されたグローバルモデルを受け取るという方法です。誰もが生データを公開することなく、計算リソースと信号を提供します。あるいは、コミュニティがデータを匿名化して、モデルのファインチューニング用のデータセットを作成することも可能です。

実践的な手順

ログを保存するには（Claude Codeはデフォルトで30日後に削除します）：

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

自身のマシンにあるデータを確認するには：

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

Redditの投稿では、コミュニティ全体で未使用のデータの実際の規模を把握し、十分な関心があればオープンな同等物を構築することを目標に、開発者にコメントで自分の数字を共有するよう呼びかけています。

📖 完全なソースを読む： r/LocalLLaMA