Проект автоисследований Карпати: ИИ-агенты проводят ночные эксперименты по обучению LLM.

Что делает проект автоисследований Карпати
Андрей Карпати выпустил небольшой репозиторий под названием "autoresearch", который демонстрирует концепцию "ИИ-исследователь в цикле". Система использует ИИ-агента для автономного запуска экспериментов по обучению LLM в течение ночи на одном GPU.
Как это работает
Агент следует такому рабочему процессу:
- Постоянно редактирует файл
train.py - Запускает 5-минутные эксперименты по обучению nanochat
- Проверяет, улучшился ли показатель валидации битов на байт (
val_bpb) - Повторяет этот цикл, пока вы спите
Настройка и конфигурация
Проект имеет очень минимальную настройку:
- Оборудование: Один GPU
- Файлы: Один основной файл
- Метрики: Одна основная метрика (
val_bpb)
Человек пишет промпт организации исследования в program.md, а агент управляет итерацией кода.
Пропускная способность экспериментов
С фиксированным бюджетом в 5 минут на эксперимент система может запускать примерно 12 экспериментов в час.
Этот подход демонстрирует практическую реализацию автоматизированных исследований, где ИИ-агенты могут автономно исследовать пространства параметров и конфигурации обучения, потенциально ускоряя циклы экспериментов для разработчиков, работающих с языковыми моделями.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Счет за Навыки: Структура Управления Навыками Кодирования ИИ на Основе Markdown
Разработчик создал Skill Bill — фреймворк из 44 навыков ИИ на основе Markdown для Kotlin, Android/KMP, PHP и Go, решающий проблемы управления промптами, такие как дрейф наименований и дублирование логики. Он включает навыки-оркестраторы, такие как 'feature-implement', которые объединяют 10-12 вызовов навыков в цепочку и синхронизируются с Claude Code, Copilot, GLM и Codex.

Adeu v1.4: MCP с открытым исходным кодом для отслеживания изменений в DOCX
Adeu v1.4 хирургически внедряет нативные исправления OOXML в файлы DOCX, сохраняя форматирование, нумерацию и макеты. Добавлено редактирование сносок и концевых сносок в строке, проверка определенных терминов, карты перекрестных ссылок и двунаправленная конвертация многоуровневых списков.

Deblank: Инструмент для Удаления Форматирования Кода с Целью Сокращения Токенов для LLM
Deblank — это инструмент с открытым исходным кодом, который удаляет форматирование кода (отступы, пробелы, переносы строк) перед отправкой в LLM, сокращая количество токенов примерно на 30% для Java/C++ и на 9% для Python с задержкой около 76 мс. Поддерживает Python, Java, C/C++, C#, JS/TS и Go.

CC-Wiki: Превратите сессии Claude Code в общедоступную базу знаний Quartz
CC-Wiki преобразует историю сессий ~/.claude в базу знаний на основе Quartz. Установка одной командой; запуск /cc-wiki внутри сессии Claude Code упаковывает беседу.