Журналы сессий агента кодирования хранятся локально, что может обеспечить открытое федеративное обучение.

✍️ OpenClawRadar📅 Опубликовано: 25 февраля 2026 г.🔗 Source
Журналы сессий агента кодирования хранятся локально, что может обеспечить открытое федеративное обучение.
Ad

Когда вы используете кодирующих агентов, таких как Claude Code или Codex CLI, в режиме агента, они записывают подробные данные сессий локально на вашем компьютере. Эти журналы фиксируют полный цикл взаимодействия: вашу первоначальную задачу, процесс рассуждения модели, каждый сделанный вызов инструмента, каждый ответ среды, каждую встреченную ошибку и каждую попытку повтора. Это создаёт полные кортежи (состояние → действие → вознаграждение → следующее состояние) — точный формат данных, необходимый исследователям обучения с подкреплением.

Что находится в журналах

Автор источника проверил свои собственные машины и обнаружил:

  • Mac Mini: ~/.claude/projects/ содержащий 3.1 ГБ в 1103 файлах из 574 агентских сессий
  • MacBook: ~/.codex/sessions/ содержащий 2.4 ГБ в 3530 файлах из 79 агентских сессий
  • MacBook: ~/.claude/projects/ содержащий 652 МБ в 316 файлах из 99 агентских сессий

В общей сложности они идентифицировали 775 сессий с реальными вызовами инструментов, содержащих примерно 41 миллион токенов. Экстраполируя на тысячи разработчиков, это может представлять сотни миллиардов токенов реальных данных агентских траекторий — данных, для которых в настоящее время нет открытого аналога, такого как набор данных The Pile.

Почему эти данные важны

Среда предоставляет чёткие сигналы обратной связи: код выхода 0 или нет, тесты проходят или нет. Это даёт недостающий обучающий сигнал для причинно-следственных рассуждений, восстановления после ошибок и долгосрочного планирования — областей, в которых текущие модели испытывают трудности. Крупные AI-лаборатории уже собирают эти данные внутри для обучения своих проприетарных моделей, но открытого аналога нет, потому что данные фрагментированы на отдельных машинах разработчиков.

Ad

Предложение: Федеративное обучение

В посте предлагается использовать федеративное обучение, где ваши данные никогда не покидают вашу машину. Вы будете обучать небольшой адаптер LoRA локально, делиться только весами с добавленным дифференциально-приватным шумом и получать взамен улучшенную глобальную модель. Каждый вносит вклад в вычисления и сигнал, не раскрывая свои исходные данные. В качестве альтернативы сообщество могло бы анонимизировать данные, чтобы создать набор данных для тонкой настройки моделей.

Практические шаги

Чтобы сохранить ваши журналы (Claude Code удаляет их по умолчанию через 30 дней):

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

Чтобы проверить, что находится на ваших собственных машинах:

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

Пост на Reddit призывает разработчиков делиться своими цифрами в комментариях, чтобы оценить реальный масштаб неиспользуемых данных в сообществе, с целью создания открытого аналога, если будет достаточно интереса.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Обновление OpenClaw 2026.3.22: Полезные функции, но три критические проблемы требуют осторожности
Новости

Обновление OpenClaw 2026.3.22: Полезные функции, но три критические проблемы требуют осторожности

Обновление OpenClaw 2026.3.22 добавляет полезные функции, такие как команда /btw, настраиваемость монитора здоровья, исправление ответов в Telegram и настройки логики по умолчанию для каждого агента, но три открытых проблемы (#53158, #53202, #53195) делают его рискованным для немедленного развертывания без мониторинга.

OpenClawRadar
Отчет Anthropic об интенсивности внедрения искусственного интеллекта в мире
Новости

Отчет Anthropic об интенсивности внедрения искусственного интеллекта в мире

Последние данные Anthropic показывают неравномерное внедрение ИИ в мире, измеряя интенсивность использования, а не общее количество пользователей. Отчёт демонстрирует, где ИИ интегрирован в рабочие процессы, такие как программирование, исследования и принятие решений, как среди частных лиц, так и в бизнесе.

OpenClawRadar
Google передает протокол платежей агентов (AP2) альянсу FIDO, выпускает v0.2 с платежами «Человек не присутствует»
Новости

Google передает протокол платежей агентов (AP2) альянсу FIDO, выпускает v0.2 с платежами «Человек не присутствует»

Google передает протокол агентских платежей (AP2) альянсу FIDO и выпускает версию 0.2 с поддержкой автономных платежей "Человек не присутствует" и нового стандарта проверяемых намерений, разработанного совместно с Mastercard.

OpenClawRadar
Выбор лучшего поставщика токенов для ваших потребностей в API
Новости

Выбор лучшего поставщика токенов для ваших потребностей в API

Изучите ключевые факторы, которые следует учитывать при выборе провайдера токенов и API в ИИ-программировании и автоматизации, основываясь на мнениях сообщества OpenClaw.

OpenClawRadar