코딩 에이전트 세션 로그 로컬 저장 및 연합 학습 활용법

Claude Code나 Codex CLI와 같은 코딩 에이전트를 에이전트 모드로 사용할 때, 이들은 사용자의 컴퓨터에 포괄적인 세션 데이터를 로컬에 기록합니다. 이러한 로그는 전체 상호작용 루프를 담고 있습니다: 초기 작업, 모델의 추론 과정, 수행된 모든 도구 호출, 모든 환경 응답, 발생한 모든 오류와 재시도 시도. 이는 완전한 (상태 → 행동 → 보상 → 다음 상태) 튜플을 생성합니다—이는 강화 학습 연구자들이 필요로 하는 정확한 데이터 형식입니다.

로그에 포함된 내용

원문 작성자는 자신의 컴퓨터를 확인하여 다음과 같은 내용을 발견했습니다:

Mac Mini: ~/.claude/projects/ 디렉토리에 574개의 에이전트 세션에서 생성된 1103개 파일, 총 3.1GB
MacBook: ~/.codex/sessions/ 디렉토리에 79개의 에이전트 세션에서 생성된 3530개 파일, 총 2.4GB
MacBook: ~/.claude/projects/ 디렉토리에 99개의 에이전트 세션에서 생성된 316개 파일, 총 652MB

전체적으로, 실제 도구 호출을 포함하는 775개의 세션을 확인했으며, 이는 약 4천1백만 토큰에 해당합니다. 수천 명의 개발자들로 확장하면, 이는 수천억 토큰 규모의 실제 에이전트 궤적 데이터를 나타낼 수 있습니다—현재 The Pile 데이터셋과 같은 공개 대안이 없는 데이터입니다.

이 데이터의 중요성

환경은 명확한 피드백 신호를 제공합니다: 종료 코드 0 여부, 테스트 통과 여부. 이는 인과적 추론, 오류 복구, 장기적 계획—현재 모델들이 어려움을 겪는 분야—에 필요한 학습 신호를 제공합니다. 대형 AI 연구실들은 이미 자체적으로 이 데이터를 수집하여 독점 모델을 훈련하고 있지만, 데이터가 개별 개발자들의 컴퓨터에 분산되어 있어 공개 대안이 없습니다.

제안: 연합 학습

해당 게시물은 사용자의 데이터가 컴퓨터를 떠나지 않는 연합 학습을 사용할 것을 제안합니다. 로컬에서 작은 LoRA 어댑터를 훈련하고, 차등 프라이버시 노이즈가 추가된 가중치만 공유하며, 개선된 글로벌 모델을 돌려받는 방식입니다. 모든 참여자는 원시 데이터를 노출하지 않고도 컴퓨팅 자원과 신호를 기여합니다. 또는 커뮤니티가 데이터를 익명화하여 모델 미세 조정을 위한 데이터셋을 생성할 수도 있습니다.

실용적인 단계

로그를 보존하려면 (Claude Code는 기본적으로 30일 후 로그를 삭제합니다):

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

자신의 컴퓨터에 무엇이 있는지 확인하려면:

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

Reddit 게시물은 개발자들이 커뮤니티 전체에 걸쳐 사용되지 않은 데이터의 실제 규모를 파악하기 위해 댓글에 자신들의 숫자를 공유하도록 권장하며, 충분한 관심이 있다면 공개 대안을 구축하는 것을 목표로 합니다.

📖 전체 출처 읽기: r/LocalLLaMA