Автоисследования Карпати: ИИ-агент запускает ночные эксперименты LLM

Что делает проект автоисследований Карпати

Андрей Карпати выпустил небольшой репозиторий под названием "autoresearch", который демонстрирует концепцию "ИИ-исследователь в цикле". Система использует ИИ-агента для автономного запуска экспериментов по обучению LLM в течение ночи на одном GPU.

Как это работает

Агент следует такому рабочему процессу:

Постоянно редактирует файл train.py
Запускает 5-минутные эксперименты по обучению nanochat
Проверяет, улучшился ли показатель валидации битов на байт (val_bpb)
Повторяет этот цикл, пока вы спите

Настройка и конфигурация

Проект имеет очень минимальную настройку:

Оборудование: Один GPU
Файлы: Один основной файл
Метрики: Одна основная метрика (val_bpb)

Человек пишет промпт организации исследования в program.md, а агент управляет итерацией кода.

Пропускная способность экспериментов

С фиксированным бюджетом в 5 минут на эксперимент система может запускать примерно 12 экспериментов в час.

Этот подход демонстрирует практическую реализацию автоматизированных исследований, где ИИ-агенты могут автономно исследовать пространства параметров и конфигурации обучения, потенциально ускоряя циклы экспериментов для разработчиков, работающих с языковыми моделями.

📖 Read the full source: r/LocalLLaMA

Проект автоисследований Карпати: ИИ-агенты проводят ночные эксперименты по обучению LLM.

Что делает проект автоисследований Карпати

Как это работает

Настройка и конфигурация

Пропускная способность экспериментов

👀 Смотрите также

PocketBot: локальный автопилот с ИИ для iOS с использованием App Intents и инференса на устройстве

МЕТА-АГЕНТ SOPHIA для обслуживания ИИ-агентов

Открытый MCP-сервер подключает Claude к экономическим данным Центрального банка Бразилии

Galadriel: Открытый инструмент для поддержания "теплого" кэша для постоянных агентов Claude