コーディングエージェントのセッションログはローカルに保存され、オープンフェデレーテッドトレーニングを可能にする可能性があります

Claude CodeやCodex CLIなどのコーディングエージェントをエージェントモードで使用すると、詳細なセッションデータがローカルマシンに記録されます。これらのログには、初期タスク、モデルの推論プロセス、実行されたすべてのツール呼び出し、環境からの応答、発生したエラー、再試行の試みなど、完全なインタラクションループが記録されます。これにより、強化学習研究者が必要とする正確なデータ形式である完全な(状態→行動→報酬→次の状態)タプルが作成されます。
ログの内容
ソースの著者が自身のマシンを確認したところ、以下のような結果が見つかりました:
- Mac Mini: ~/.claude/projects/ に574回のエージェントセッションから1103ファイル、合計3.1GB
- MacBook: ~/.codex/sessions/ に79回のエージェントセッションから3530ファイル、合計2.4GB
- MacBook: ~/.claude/projects/ に99回のエージェントセッションから316ファイル、合計652MB
合計で、実際のツール呼び出しを含む775セッション、約4100万トークンが確認されました。数千人の開発者に外挿すると、これは数千億トークン規模の実際のエージェント軌跡データを表す可能性があります。このようなデータには現在、The Pileデータセットのようなオープンな同等物が存在しません。
このデータの重要性
環境は明確なフィードバック信号を提供します:終了コード0か否か、テストが合格か否か。これにより、因果推論、エラー回復、長期的な計画など、現在のモデルが苦手とする分野で不足していたトレーニング信号が得られます。大手AI研究所はすでに独自モデルのトレーニングのために内部でこのデータを収集していますが、データが個々の開発者のマシンに分散しているため、オープンな同等物は存在しません。
提案:連合学習
この投稿では、データがマシンから離れることのない連合学習の使用を提案しています。ローカルで小さなLoRAアダプターをトレーニングし、差分プライバシーノイズを加えた重みのみを共有し、改善されたグローバルモデルを受け取るという方法です。誰もが生データを公開することなく、計算リソースと信号を提供します。あるいは、コミュニティがデータを匿名化して、モデルのファインチューニング用のデータセットを作成することも可能です。
実践的な手順
ログを保存するには(Claude Codeはデフォルトで30日後に削除します):
echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json
自身のマシンにあるデータを確認するには:
du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l
Redditの投稿では、コミュニティ全体で未使用のデータの実際の規模を把握し、十分な関心があればオープンな同等物を構築することを目標に、開発者にコメントで自分の数字を共有するよう呼びかけています。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

GPT 5.5 vs Claude:開発者のリファクタリング戦記
ある開発者がGPT 5.5を使って計画を立て、Claudeを使ってコードを書くことで、36,000行ものCコードの大規模リファクタリングを実現しました。GPT 5.5は明確な計画で感銘を与えましたが、30ドルのプランで2時間で使用量の85%を消費してしまいました。

r/ClaudeAIサブレディットの週間訪問者数が50万人から190万人に急増
r/ClaudeAIサブレディットは、2025年11月の週間訪問者数約25万人から、2026年3月には190万人に成長しましたが、登録者数は約8万5千人のまま推移しています。

友人が70%のスタッフをClaudeエージェントに置き換える30万ドル超の役職を拒否 — Redditで倫理と技術的現実を議論
Redditの投稿は、ワークフローをマッピングし、Claude/GPTエージェントパイプラインを構築し、スタッフの70%を解雇する「AI移行リーダー」の役割を断った友人について述べています。投稿者は、30万ドル以上の報酬を得て、時間を無駄にし、Cスイートの妄想が崩壊するのを見る価値はあると主張しています。

PostmarketOS 2026年2月アップデート:汎用カーネルとAIポリシー
PostmarketOSは現在、汎用カーネルパッケージ(linux-postmarketos-mainline、-stable、-lts)を提供し、生成AIを明示的に禁止するAIポリシーを更新しました。プロジェクトではコントリビューターの変更やハードウェアCIの改善も行われました。