Проект автоисследований Карпати: ИИ-агенты проводят ночные эксперименты по обучению LLM.

Что делает проект автоисследований Карпати
Андрей Карпати выпустил небольшой репозиторий под названием "autoresearch", который демонстрирует концепцию "ИИ-исследователь в цикле". Система использует ИИ-агента для автономного запуска экспериментов по обучению LLM в течение ночи на одном GPU.
Как это работает
Агент следует такому рабочему процессу:
- Постоянно редактирует файл
train.py - Запускает 5-минутные эксперименты по обучению nanochat
- Проверяет, улучшился ли показатель валидации битов на байт (
val_bpb) - Повторяет этот цикл, пока вы спите
Настройка и конфигурация
Проект имеет очень минимальную настройку:
- Оборудование: Один GPU
- Файлы: Один основной файл
- Метрики: Одна основная метрика (
val_bpb)
Человек пишет промпт организации исследования в program.md, а агент управляет итерацией кода.
Пропускная способность экспериментов
С фиксированным бюджетом в 5 минут на эксперимент система может запускать примерно 12 экспериментов в час.
Этот подход демонстрирует практическую реализацию автоматизированных исследований, где ИИ-агенты могут автономно исследовать пространства параметров и конфигурации обучения, потенциально ускоряя циклы экспериментов для разработчиков, работающих с языковыми моделями.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

PocketBot: локальный автопилот с ИИ для iOS с использованием App Intents и инференса на устройстве
PocketBot — это приложение для iOS, которое запускает квантованную 3B-модель Llama локально на Neural Engine iPhone через Metal, используя фреймворки Apple AppIntents и CoreLocation для создания событийно-управляемых автоматизаций без передачи данных в облако.

МЕТА-АГЕНТ SOPHIA для обслуживания ИИ-агентов
SOPHIA — это мета-агент, разработанный в качестве главного специалиста по обучению, который наблюдает, диагностирует, исследует и предлагает улучшения для других ИИ-агентов в производственных экосистемах. Система была создана за 7 итераций с использованием 4 передовых моделей, при этом для всех развертываний требуется одобрение человека.

Открытый MCP-сервер подключает Claude к экономическим данным Центрального банка Бразилии
Сидней Биссоли создал bcb-br-mcp — сервер MCP с лицензией MIT, который предоставляет Клоду доступ к более чем 18 000 временных рядов из Центрального банка Бразилии (SGS/BCB). Сервер включает 8 инструментов, охватывающих данные по процентным ставкам, инфляции, обменным курсам, ВВП, занятости и кредитованию.

Galadriel: Открытый инструмент для поддержания "теплого" кэша для постоянных агентов Claude
Galadriel — это 3-уровневая система кэширования для Claude, которая снижает затраты на 87% и задержку до менее 3 секунд для подсказок из 100K токенов. Включает MemPalace для постоянной векторной памяти.