Agentes de Codificación Almacenan Registros Localmente: ¿Entrenamiento Federado?

Cuando usas agentes de codificación como Claude Code o Codex CLI en modo agente, registran datos completos de sesión localmente en tu máquina. Estos registros capturan todo el ciclo de interacción: tu tarea inicial, el proceso de razonamiento del modelo, cada llamada a herramienta realizada, cada respuesta del entorno, cada error encontrado y cada reintento intentado. Esto crea tuplas completas (estado → acción → recompensa → siguiente estado)—el formato exacto de datos que los investigadores de aprendizaje por refuerzo necesitan.

Qué hay en los registros

El autor de la fuente revisó sus propias máquinas y encontró:

Mac Mini: ~/.claude/projects/ conteniendo 3.1GB en 1103 archivos de 574 sesiones de agentes
MacBook: ~/.codex/sessions/ conteniendo 2.4GB en 3530 archivos de 79 sesiones de agentes
MacBook: ~/.claude/projects/ conteniendo 652MB en 316 archivos de 99 sesiones de agentes

En total, identificaron 775 sesiones con llamadas reales a herramientas que contienen aproximadamente 41 millones de tokens. Extrapolado a través de miles de desarrolladores, esto podría representar cientos de miles de millones de tokens de datos reales de trayectoria de agentes—datos que actualmente no tienen un equivalente abierto como el conjunto de datos The Pile.

Por qué importan estos datos

El entorno proporciona señales de retroalimentación claras: código de salida 0 o no, las pruebas pasan o no. Esto ofrece la señal de entrenamiento faltante para el razonamiento causal, la recuperación de errores y la planificación a largo plazo—áreas donde los modelos actuales tienen dificultades. Los grandes laboratorios de IA ya recopilan estos datos internamente para entrenar sus modelos propietarios, pero no hay un equivalente abierto porque los datos están fragmentados en las máquinas individuales de los desarrolladores.

La propuesta: Aprendizaje federado

La publicación propone usar aprendizaje federado donde tus datos nunca salen de tu máquina. Entrenarías un pequeño adaptador LoRA localmente, compartirías solo los pesos con ruido de privacidad diferencial añadido, y recibirías un modelo global mejorado a cambio. Todos contribuyen con computación y señal sin exponer sus datos en bruto. Alternativamente, la comunidad podría anonimizar los datos para crear un conjunto de datos para ajustar modelos.

Pasos prácticos

Para preservar tus registros (Claude Code los elimina después de 30 días por defecto):

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

Para revisar qué hay en tus propias máquinas:

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

La publicación de Reddit anima a los desarrolladores a compartir sus números en los comentarios para medir la escala real de datos no utilizados en la comunidad, con el objetivo de construir un equivalente abierto si hay suficiente interés.

📖 Read the full source: r/LocalLLaMA

Los Registros de Sesión del Agente de Codificación se Almacenan Localmente, Podrían Habilitar el Entrenamiento Federado Abierto

Qué hay en los registros

Por qué importan estos datos

La propuesta: Aprendizaje federado

Pasos prácticos

👀 Ver también

Claude-Code v2.1.31 Lanzamiento: Actualizaciones Clave y Correcciones de Errores

Anthropic revierte su política sobre SDK de agentes de terceros y claude-p, reduciendo el valor efectivo de inferencia entre 25 y 40 veces para suscriptores máximos

La Corte Suprema se niega a revisar el caso, el arte generado por IA sigue sin poder protegerse con derechos de autor.

OpenClaw: Cuatro Problemas Críticos que los Desarrolladores Deben Conocer