Использование Claude Code для автоматизации экспериментов по исследованию ИИ в течение 12 часов.

✍️ OpenClawRadar📅 Опубликовано: 26 февраля 2026 г.🔗 Source
Использование Claude Code для автоматизации экспериментов по исследованию ИИ в течение 12 часов.
Ad

Автоматизированное исследование ИИ с помощью Claude Code

Разработчик задокументировал использование Claude Code для автоматизации экспериментов по исследованию ИИ в течение 12 часов подряд. Проект был сосредоточен на CLaaS, фреймворке непрерывного обучения в реальном времени, который перемещает контекст в веса с помощью само-дистилляции.

Экспериментальная установка

Целью была настройка циклов обучения само-дистилляции для максимизации соответствия модели различным верификаторам предпочтений, таким как краткие ответы и отсутствие эмодзи. Эксперименты проводились локально на RTX 5090 в течение ночи.

Архитектура системы

Репозиторий был создан с высокой степенью настраиваемости:

  • Каждый настраиваемый параметр доступен через CLI с использованием управления конфигурациями Hydra
  • HTML-дашборды для каждого шага обучения и оценочного запуска
  • Метрики, входные и выходные данные сделаны наблюдаемыми через дашборды
  • Claude Code мог запрашивать дашборды через curl-запросы для проверки прогресса
Ad

Управление экспериментами

Рабочий процесс контролировался локальным файлом EXPERIMENTS.md с конкретными правилами:

  • Каждый эксперимент мог изменять не более одной переменной или вносить одно изменение в код
  • Между экспериментами модель должна была либо принять, либо отменить предыдущее изменение на основе результатов
  • Любые новые изменения кода должны были быть доступны через конфигурацию для последующей настройки
  • Модель записывала весь прогресс, гипотезы и результаты в файл как текущий журнал
  • Использовался "цикл Ральфа Виггама" с целью максимизации соответствия предпочтениям

Результаты

За 12 часов система провела 9 экспериментов:

  • Обнаружила и исправила ошибку коллапса модели при первом запуске
  • Настроила количество шагов градиента на пакет до 4
  • Настроила скорость обучения до 3e-5
  • Соответствие улучшилось с 0.000 до 1.000
  • Использование токенов было удивительно низким, поскольку большая часть времени уходила на ожидание циклов обучения между экспериментами

Та же задача также была запущена с Codex в течение 2 часов с использованием простого промпта, и он независимо пришёл к тем же гиперпараметрам.

Репозиторий проекта: https://github.com/kfallah/CLaaS

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Реализация OpenClaw для логистической компании: парсинг электронной почты и обновление статусов
Кейсы

Реализация OpenClaw для логистической компании: парсинг электронной почты и обновление статусов

Разработчик настроил OpenClaw для небольшой логистической компании, чтобы автоматизировать парсинг электронной почты, перекрестную проверку таблиц и обновление статусов, что позволило владельцу экономить 2-3 часа ежедневно при минимальном количестве кода.

OpenClawRadar
Агент OpenClaw создает CAD-модели и STL-файлы на основе заданных размеров.
Кейсы

Агент OpenClaw создает CAD-модели и STL-файлы на основе заданных размеров.

Пользователь обнаружил, что его агент OpenClaw может создавать файлы STL и SCAD по заданным размерам, производя функциональные 3D-модели с точными требуемыми размерами примерно за 20 секунд.

OpenClawRadar
Локальный клон Reddit для ИИ-агентов улучшает качество кода и тестирование.
Кейсы

Локальный клон Reddit для ИИ-агентов улучшает качество кода и тестирование.

Разработчик создал локальный клон Reddit под названием 'community center' для ИИ-агентов, чтобы они публиковали обновления по задачам, проблемы и блокировки. Агенты взаимодействуют только во время проверок состояния и выполнения задач, получая уведомления при упоминании или новой активности в их постах.

OpenClawRadar
Разработчик заменяет AI-агента на прямой скрипт Playwright для автоматизации браузера.
Кейсы

Разработчик заменяет AI-агента на прямой скрипт Playwright для автоматизации браузера.

Разработчик использовал OpenClaw для создания агента Gemma 4 31B для автоматизации браузера через Playwright, но столкнулся с проблемами некорректных вызовов API и таймаутами. Он заменил всего агента на 50-строчный скрипт, который напрямую взаимодействует с Chrome, выполнив задачу за 10 секунд.

OpenClawRadar