Журналы сессий агента кодирования хранятся локально, что может обеспечить открытое федеративное обучение.

Когда вы используете кодирующих агентов, таких как Claude Code или Codex CLI, в режиме агента, они записывают подробные данные сессий локально на вашем компьютере. Эти журналы фиксируют полный цикл взаимодействия: вашу первоначальную задачу, процесс рассуждения модели, каждый сделанный вызов инструмента, каждый ответ среды, каждую встреченную ошибку и каждую попытку повтора. Это создаёт полные кортежи (состояние → действие → вознаграждение → следующее состояние) — точный формат данных, необходимый исследователям обучения с подкреплением.
Что находится в журналах
Автор источника проверил свои собственные машины и обнаружил:
- Mac Mini: ~/.claude/projects/ содержащий 3.1 ГБ в 1103 файлах из 574 агентских сессий
- MacBook: ~/.codex/sessions/ содержащий 2.4 ГБ в 3530 файлах из 79 агентских сессий
- MacBook: ~/.claude/projects/ содержащий 652 МБ в 316 файлах из 99 агентских сессий
В общей сложности они идентифицировали 775 сессий с реальными вызовами инструментов, содержащих примерно 41 миллион токенов. Экстраполируя на тысячи разработчиков, это может представлять сотни миллиардов токенов реальных данных агентских траекторий — данных, для которых в настоящее время нет открытого аналога, такого как набор данных The Pile.
Почему эти данные важны
Среда предоставляет чёткие сигналы обратной связи: код выхода 0 или нет, тесты проходят или нет. Это даёт недостающий обучающий сигнал для причинно-следственных рассуждений, восстановления после ошибок и долгосрочного планирования — областей, в которых текущие модели испытывают трудности. Крупные AI-лаборатории уже собирают эти данные внутри для обучения своих проприетарных моделей, но открытого аналога нет, потому что данные фрагментированы на отдельных машинах разработчиков.
Предложение: Федеративное обучение
В посте предлагается использовать федеративное обучение, где ваши данные никогда не покидают вашу машину. Вы будете обучать небольшой адаптер LoRA локально, делиться только весами с добавленным дифференциально-приватным шумом и получать взамен улучшенную глобальную модель. Каждый вносит вклад в вычисления и сигнал, не раскрывая свои исходные данные. В качестве альтернативы сообщество могло бы анонимизировать данные, чтобы создать набор данных для тонкой настройки моделей.
Практические шаги
Чтобы сохранить ваши журналы (Claude Code удаляет их по умолчанию через 30 дней):
echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json
Чтобы проверить, что находится на ваших собственных машинах:
du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l
Пост на Reddit призывает разработчиков делиться своими цифрами в комментариях, чтобы оценить реальный масштаб неиспользуемых данных в сообществе, с целью создания открытого аналога, если будет достаточно интереса.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Обновление OpenClaw 2026.3.22: Полезные функции, но три критические проблемы требуют осторожности
Обновление OpenClaw 2026.3.22 добавляет полезные функции, такие как команда /btw, настраиваемость монитора здоровья, исправление ответов в Telegram и настройки логики по умолчанию для каждого агента, но три открытых проблемы (#53158, #53202, #53195) делают его рискованным для немедленного развертывания без мониторинга.

Отчет Anthropic об интенсивности внедрения искусственного интеллекта в мире
Последние данные Anthropic показывают неравномерное внедрение ИИ в мире, измеряя интенсивность использования, а не общее количество пользователей. Отчёт демонстрирует, где ИИ интегрирован в рабочие процессы, такие как программирование, исследования и принятие решений, как среди частных лиц, так и в бизнесе.

Google передает протокол платежей агентов (AP2) альянсу FIDO, выпускает v0.2 с платежами «Человек не присутствует»
Google передает протокол агентских платежей (AP2) альянсу FIDO и выпускает версию 0.2 с поддержкой автономных платежей "Человек не присутствует" и нового стандарта проверяемых намерений, разработанного совместно с Mastercard.

Выбор лучшего поставщика токенов для ваших потребностей в API
Изучите ключевые факторы, которые следует учитывать при выборе провайдера токенов и API в ИИ-программировании и автоматизации, основываясь на мнениях сообщества OpenClaw.