OpenEvol: Потоковая система автономного самосовершенствования для больших языковых моделей с использованием истории диалога

✍️ OpenClawRadar📅 Опубликовано: 31 марта 2026 г.🔗 Source
OpenEvol: Потоковая система автономного самосовершенствования для больших языковых моделей с использованием истории диалога
Ad

Что делает OpenEvol

OpenEvol — это автономный конвейер самообучения для больших языковых моделей, который автоматически преобразует историю диалогов ИИ в обучающие данные. Инструмент извлекает из диалогов ценные обмены, оценивает их качество и генерирует наборы данных для тонкой настройки без ручной разметки или проприетарных циклов данных.

Как это работает

Конвейер проходит четыре автоматизированных этапа:

  • Извлечение ценных обменов из диалогов
  • Оценка качества с помощью правил и опционально LLM-учителя
  • Синтез наборов данных для SFT, предпочтений и предобучения
  • Тонкая настройка одной командой

Это создаёт замкнутый цикл, в котором модель учится на собственном опыте.

Технические детали

Для начала работы GPU не требуется — весь конвейер работает на CPU с имитационным или совместимым с OpenAI бэкендом-учителем. GPU можно подключить, когда будет готово к обучению.

Поддерживаются пять бэкендов-учителей:

  • Имитационный (Mock)
  • На основе правил (Rule-based)
  • API, совместимый с OpenAI (подходит любой локальный прокси)
  • HuggingFace Transformers
  • vLLM
Ad

Варианты использования

Три способа использования OpenEvol:

  • CLI для автономных пакетных запусков
  • REST API сервер для автоматизации
  • Плагин OpenClaw для рабочего стола, позволяющий запускать конвейер прямо из чата

Контроль качества

Каждая партия автоматически оценивается. Если уровень одобрения падает ниже 80%, обучение блокируется и помечается для проверки человеком, что даёт пользователям контроль над данными, используемыми для обучения.

Такой инструмент полезен разработчикам, которые хотят улучшить своих ИИ-агентов для программирования, используя реальную историю диалогов без отправки данных внешним сервисам.

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Клод Код HUD: Терминальная панель для мониторинга сессий ИИ-программирования
Инструменты

Клод Код HUD: Терминальная панель для мониторинга сессий ИИ-программирования

claude-code-hud — это терминальная панель управления, которая обеспечивает мониторинг сессий Claude Code в реальном времени, показывая использование контекстного окна, ограничения скорости API и изменения файлов без необходимости в IDE. Запускается командой npx claude-code-hud.

OpenClawRadar
Клод как компилятор: Практический пересмотр подхода к разработке ИИ
Инструменты

Клод как компилятор: Практический пересмотр подхода к разработке ИИ

В посте на Reddit утверждается, что Claude Code функционирует как компилятор, переводящий английский язык в работающее программное обеспечение, проводя параллели с историческими прорывами в вычислительной технике, такими как A-0 Грейс Хоппер и FORTRAN. Автор описывает генерацию 400 строк кода в 6 файлах из трёх абзацев описания на английском, обнаружив две проблемы за 25 минут.

OpenClawRadar
MegaClaw: Контейнеризованная установка OpenClaw с Playwright и Homebrew
Инструменты

MegaClaw: Контейнеризованная установка OpenClaw с Playwright и Homebrew

MegaClaw — это двухобразная конфигурация Podman для OpenClaw, которая решает распространённые проблемы установки, такие как ошибки прав доступа и отсутствующие зависимости. Она использует многоэтапную сборку с предустановленными Playwright и Homebrew, а также включает пользовательскую конфигурацию в образ для выполнения.

OpenClawRadar
Как компания Mendral сократила затраты на LLM, перейдя на Opus: шаблон триажера, доступ к SQL и архитектура под-агентов
Инструменты

Как компания Mendral сократила затраты на LLM, перейдя на Opus: шаблон триажера, доступ к SQL и архитектура под-агентов

Mendral перешел с Sonnet на Opus 4.6 для анализа сбоев CI, но сократил расходы, используя Haiku для сортировки, отсеивающей 80% сбоев, предоставив агентам SQL-доступ к ClickHouse вместо отправки логов, и запуская дешевые под-агенты для непосредственного анализа.

OpenClawRadar