Los Registros de Sesión del Agente de Codificación se Almacenan Localmente, Podrían Habilitar el Entrenamiento Federado Abierto

Cuando usas agentes de codificación como Claude Code o Codex CLI en modo agente, registran datos completos de sesión localmente en tu máquina. Estos registros capturan todo el ciclo de interacción: tu tarea inicial, el proceso de razonamiento del modelo, cada llamada a herramienta realizada, cada respuesta del entorno, cada error encontrado y cada reintento intentado. Esto crea tuplas completas (estado → acción → recompensa → siguiente estado)—el formato exacto de datos que los investigadores de aprendizaje por refuerzo necesitan.
Qué hay en los registros
El autor de la fuente revisó sus propias máquinas y encontró:
- Mac Mini: ~/.claude/projects/ conteniendo 3.1GB en 1103 archivos de 574 sesiones de agentes
- MacBook: ~/.codex/sessions/ conteniendo 2.4GB en 3530 archivos de 79 sesiones de agentes
- MacBook: ~/.claude/projects/ conteniendo 652MB en 316 archivos de 99 sesiones de agentes
En total, identificaron 775 sesiones con llamadas reales a herramientas que contienen aproximadamente 41 millones de tokens. Extrapolado a través de miles de desarrolladores, esto podría representar cientos de miles de millones de tokens de datos reales de trayectoria de agentes—datos que actualmente no tienen un equivalente abierto como el conjunto de datos The Pile.
Por qué importan estos datos
El entorno proporciona señales de retroalimentación claras: código de salida 0 o no, las pruebas pasan o no. Esto ofrece la señal de entrenamiento faltante para el razonamiento causal, la recuperación de errores y la planificación a largo plazo—áreas donde los modelos actuales tienen dificultades. Los grandes laboratorios de IA ya recopilan estos datos internamente para entrenar sus modelos propietarios, pero no hay un equivalente abierto porque los datos están fragmentados en las máquinas individuales de los desarrolladores.
La propuesta: Aprendizaje federado
La publicación propone usar aprendizaje federado donde tus datos nunca salen de tu máquina. Entrenarías un pequeño adaptador LoRA localmente, compartirías solo los pesos con ruido de privacidad diferencial añadido, y recibirías un modelo global mejorado a cambio. Todos contribuyen con computación y señal sin exponer sus datos en bruto. Alternativamente, la comunidad podría anonimizar los datos para crear un conjunto de datos para ajustar modelos.
Pasos prácticos
Para preservar tus registros (Claude Code los elimina después de 30 días por defecto):
echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json
Para revisar qué hay en tus propias máquinas:
du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l
La publicación de Reddit anima a los desarrolladores a compartir sus números en los comentarios para medir la escala real de datos no utilizados en la comunidad, con el objetivo de construir un equivalente abierto si hay suficiente interés.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Claude Code 2.1.76 añade solicitud MCP, mejoras en worktree y correcciones para límites de contexto.
La versión 2.1.76 de Claude Code introduce soporte de elicitación MCP para entrada estructurada durante tareas, añade worktree.sparsePaths para grandes monorepos y corrige errores de 'Límite de contexto alcanzado' en sesiones de 1M de contexto. La versión 2.1.75 estableció ventanas de contexto de 1M por defecto para Opus 4.6 en planes Max, Team y Enterprise.

Cowork puede usar una instancia de Chrome en otra máquina sin que usted lo sepa
Un usuario de Reddit descubrió que Cowork puede ejecutar tareas del navegador usando una instancia de Chrome en otra máquina (Windows) emparejada a través de una extensión, marcada como isLocal: false — algo no documentado.

¿Está realmente obsoleto Minimax? Una mirada a los debates actuales
En el mundo de la IA y la automatización tecnológica, una discusión en Reddit plantea preguntas sobre la relevancia del algoritmo Minimax. ¿Está realmente obsoleto o todavía tiene valor en las aplicaciones de IA modernas?

sseanliu/VisionClaw trae asistencia de IA en tiempo real a las gafas inteligentes Meta Ray-Ban.
La VisiónClaw de sseanliu ofrece un asistente de IA revolucionario para las gafas inteligentes Meta Ray-Ban, combinando voz, visión y acciones autónomas impulsadas por Gemini Live y OpenClaw.