OpenEvol: Потоковая система автономного самосовершенствования для больших языковых моделей с использованием истории диалога

Что делает OpenEvol
OpenEvol — это автономный конвейер самообучения для больших языковых моделей, который автоматически преобразует историю диалогов ИИ в обучающие данные. Инструмент извлекает из диалогов ценные обмены, оценивает их качество и генерирует наборы данных для тонкой настройки без ручной разметки или проприетарных циклов данных.
Как это работает
Конвейер проходит четыре автоматизированных этапа:
- Извлечение ценных обменов из диалогов
- Оценка качества с помощью правил и опционально LLM-учителя
- Синтез наборов данных для SFT, предпочтений и предобучения
- Тонкая настройка одной командой
Это создаёт замкнутый цикл, в котором модель учится на собственном опыте.
Технические детали
Для начала работы GPU не требуется — весь конвейер работает на CPU с имитационным или совместимым с OpenAI бэкендом-учителем. GPU можно подключить, когда будет готово к обучению.
Поддерживаются пять бэкендов-учителей:
- Имитационный (Mock)
- На основе правил (Rule-based)
- API, совместимый с OpenAI (подходит любой локальный прокси)
- HuggingFace Transformers
- vLLM
Варианты использования
Три способа использования OpenEvol:
- CLI для автономных пакетных запусков
- REST API сервер для автоматизации
- Плагин OpenClaw для рабочего стола, позволяющий запускать конвейер прямо из чата
Контроль качества
Каждая партия автоматически оценивается. Если уровень одобрения падает ниже 80%, обучение блокируется и помечается для проверки человеком, что даёт пользователям контроль над данными, используемыми для обучения.
Такой инструмент полезен разработчикам, которые хотят улучшить своих ИИ-агентов для программирования, используя реальную историю диалогов без отправки данных внешним сервисам.
📖 Read the full source: r/openclaw
👀 Смотрите также

Клод Код HUD: Терминальная панель для мониторинга сессий ИИ-программирования
claude-code-hud — это терминальная панель управления, которая обеспечивает мониторинг сессий Claude Code в реальном времени, показывая использование контекстного окна, ограничения скорости API и изменения файлов без необходимости в IDE. Запускается командой npx claude-code-hud.

Клод как компилятор: Практический пересмотр подхода к разработке ИИ
В посте на Reddit утверждается, что Claude Code функционирует как компилятор, переводящий английский язык в работающее программное обеспечение, проводя параллели с историческими прорывами в вычислительной технике, такими как A-0 Грейс Хоппер и FORTRAN. Автор описывает генерацию 400 строк кода в 6 файлах из трёх абзацев описания на английском, обнаружив две проблемы за 25 минут.

MegaClaw: Контейнеризованная установка OpenClaw с Playwright и Homebrew
MegaClaw — это двухобразная конфигурация Podman для OpenClaw, которая решает распространённые проблемы установки, такие как ошибки прав доступа и отсутствующие зависимости. Она использует многоэтапную сборку с предустановленными Playwright и Homebrew, а также включает пользовательскую конфигурацию в образ для выполнения.

Как компания Mendral сократила затраты на LLM, перейдя на Opus: шаблон триажера, доступ к SQL и архитектура под-агентов
Mendral перешел с Sonnet на Opus 4.6 для анализа сбоев CI, но сократил расходы, используя Haiku для сортировки, отсеивающей 80% сбоев, предоставив агентам SQL-доступ к ClickHouse вместо отправки логов, и запуская дешевые под-агенты для непосредственного анализа.