코딩 에이전트 세션 로그는 로컬에 저장되며, 개방형 연합 학습을 가능하게 할 수 있습니다.

✍️ OpenClawRadar📅 게시일: February 25, 2026🔗 Source
코딩 에이전트 세션 로그는 로컬에 저장되며, 개방형 연합 학습을 가능하게 할 수 있습니다.
Ad

Claude Code나 Codex CLI와 같은 코딩 에이전트를 에이전트 모드로 사용할 때, 이들은 사용자의 컴퓨터에 포괄적인 세션 데이터를 로컬에 기록합니다. 이러한 로그는 전체 상호작용 루프를 담고 있습니다: 초기 작업, 모델의 추론 과정, 수행된 모든 도구 호출, 모든 환경 응답, 발생한 모든 오류와 재시도 시도. 이는 완전한 (상태 → 행동 → 보상 → 다음 상태) 튜플을 생성합니다—이는 강화 학습 연구자들이 필요로 하는 정확한 데이터 형식입니다.

로그에 포함된 내용

원문 작성자는 자신의 컴퓨터를 확인하여 다음과 같은 내용을 발견했습니다:

  • Mac Mini: ~/.claude/projects/ 디렉토리에 574개의 에이전트 세션에서 생성된 1103개 파일, 총 3.1GB
  • MacBook: ~/.codex/sessions/ 디렉토리에 79개의 에이전트 세션에서 생성된 3530개 파일, 총 2.4GB
  • MacBook: ~/.claude/projects/ 디렉토리에 99개의 에이전트 세션에서 생성된 316개 파일, 총 652MB

전체적으로, 실제 도구 호출을 포함하는 775개의 세션을 확인했으며, 이는 약 4천1백만 토큰에 해당합니다. 수천 명의 개발자들로 확장하면, 이는 수천억 토큰 규모의 실제 에이전트 궤적 데이터를 나타낼 수 있습니다—현재 The Pile 데이터셋과 같은 공개 대안이 없는 데이터입니다.

이 데이터의 중요성

환경은 명확한 피드백 신호를 제공합니다: 종료 코드 0 여부, 테스트 통과 여부. 이는 인과적 추론, 오류 복구, 장기적 계획—현재 모델들이 어려움을 겪는 분야—에 필요한 학습 신호를 제공합니다. 대형 AI 연구실들은 이미 자체적으로 이 데이터를 수집하여 독점 모델을 훈련하고 있지만, 데이터가 개별 개발자들의 컴퓨터에 분산되어 있어 공개 대안이 없습니다.

Ad

제안: 연합 학습

해당 게시물은 사용자의 데이터가 컴퓨터를 떠나지 않는 연합 학습을 사용할 것을 제안합니다. 로컬에서 작은 LoRA 어댑터를 훈련하고, 차등 프라이버시 노이즈가 추가된 가중치만 공유하며, 개선된 글로벌 모델을 돌려받는 방식입니다. 모든 참여자는 원시 데이터를 노출하지 않고도 컴퓨팅 자원과 신호를 기여합니다. 또는 커뮤니티가 데이터를 익명화하여 모델 미세 조정을 위한 데이터셋을 생성할 수도 있습니다.

실용적인 단계

로그를 보존하려면 (Claude Code는 기본적으로 30일 후 로그를 삭제합니다):

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

자신의 컴퓨터에 무엇이 있는지 확인하려면:

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

Reddit 게시물은 개발자들이 커뮤니티 전체에 걸쳐 사용되지 않은 데이터의 실제 규모를 파악하기 위해 댓글에 자신들의 숫자를 공유하도록 권장하며, 충분한 관심이 있다면 공개 대안을 구축하는 것을 목표로 합니다.

📖 전체 출처 읽기: r/LocalLLaMA

Ad

👀 See Also

OpenClaw 5.2 마이그레이션, 크론 작업 및 MCP 플러그인 호출 중단
News

OpenClaw 5.2 마이그레이션, 크론 작업 및 MCP 플러그인 호출 중단

OpenClaw 4.23에서 5.2로 업그레이드하면 MCP 툴 플러그인이 표시되지만 에이전트가 호출할 수 없게 되고, CLI를 통한 크론 작업 등록이 기기 페어링 오류로 실패합니다.

OpenClawRadar
API 요구 사항에 맞는 최적의 토큰 제공자 선택하기
News

API 요구 사항에 맞는 최적의 토큰 제공자 선택하기

OpenClaw 커뮤니티의 인사이트를 바탕으로 AI 코딩 및 자동화에서 토큰과 API 제공자를 선택할 때 고려해야 할 핵심 요소를 살펴보세요.

OpenClawRadar
Gemma 4 초기 신호: 로컬 에이전트 워크플로우에서는 과대 광고보다 배포 적합성이 중요하다
News

Gemma 4 초기 신호: 로컬 에이전트 워크플로우에서는 과대 광고보다 배포 적합성이 중요하다

Gemma 4의 출시는 개인용 하드웨어와 엣지/모바일을 위한 공식 포지셔닝과 함께 다양한 하드웨어 계층에 걸친 배포를 강조하며, NVIDIA의 NVFP4 양자화가 GPQA에서 99.7%의 기준 성능 유지와 함께 4배 압축을 보여주고, Arena 순위에서 31B 조밀 모델이 약 27위에 위치하고 있습니다.

OpenClawRadar
하이브리드 AI 아키텍처: 오픈소스 구성 요소와 독점 추론 모델의 결합
News

하이브리드 AI 아키텍처: 오픈소스 구성 요소와 독점 추론 모델의 결합

실용적인 하이브리드 AI 아키텍처가 부상하고 있습니다. 89%의 조직이 비용을 50% 이상 절감하기 위해 오픈소스 구성 요소를 사용하는 반면, 독점 모델은 복잡한 추론 작업을 처리합니다. 오픈소스 프레임워크는 라이선스 협상 없이도 투명성과 미세 조정 기능을 제공합니다.

OpenClawRadar