OpenEvol: Pipeline de Autoaperfeiçoamento Offline para LLMs Usando Histórico de Conversas

O que o OpenEvol faz
OpenEvol é um pipeline de autoaperfeiçoamento offline para modelos de linguagem grandes que converte automaticamente o histórico de conversas de IA em dados de treinamento. A ferramenta minera trocas de alto valor das conversas, julga sua qualidade e gera conjuntos de dados de ajuste fino sem rotulagem manual ou ciclos de dados proprietários.
Como funciona
O pipeline percorre quatro estágios automatizados:
- Minera trocas de alto valor das conversas
- Julga a qualidade usando regras com um modelo de linguagem professor opcional
- Sintetiza conjuntos de dados SFT, preferência e pré-treinamento
- Ajusta fino com um comando
Isso cria um ciclo fechado onde o modelo aprende com sua própria experiência.
Detalhes técnicos
Nenhuma GPU é necessária para começar - o pipeline completo roda em CPU com um backend de professor simulado ou compatível com OpenAI. Você pode trazer uma GPU quando estiver pronto para treinar.
Cinco backends de professor são suportados:
- Simulado
- Baseado em regras
- API compatível com OpenAI (qualquer proxy local funciona)
- HuggingFace Transformers
- vLLM
Opções de uso
Três maneiras de usar o OpenEvol:
- CLI para execuções em lote offline
- Servidor REST API para automação
- Plugin de desktop OpenClaw que permite acionar execuções do pipeline diretamente do chat
Controle de qualidade
Cada lote é pontuado automaticamente. Se a taxa de aprovação cair abaixo de 80%, o treinamento é bloqueado e sinalizado para revisão humana, dando aos usuários controle sobre quais dados são usados para treinamento.
Esse tipo de ferramenta é útil para desenvolvedores que desejam melhorar seus agentes de codificação de IA usando o histórico real de conversas sem enviar dados para serviços externos.
📖 Read the full source: r/openclaw
👀 See Also

Wrangle: Um Editor Nativo do macOS para Gerenciar Sessões de Código do Claude
Wrangle é um editor de markdown nativo para macOS desenvolvido especificamente para gerenciar múltiplas sessões do Claude Code, com terminais embutidos e notificações inteligentes. O desenvolvedor criou o aplicativo depois que o VS Code não conseguiu acompanhar seu fluxo de trabalho diário de executar muitas sessões do Claude Code.

Flash-MoE: Executando o Modelo Qwen de 397B Parâmetros no MacBook Pro com C/Metal Puro
Flash-MoE é um mecanismo de inferência puro em C/Metal que executa o modelo Qwen3.5-397B-A17B, um modelo Mixture-of-Experts com 397 bilhões de parâmetros, em um MacBook Pro com 48GB de RAM a 4.4+ tokens/segundo. O modelo de 209GB é transmitido do SSD por meio de shaders de computação Metal personalizados, sem Python ou frameworks.

MoltSoup: Um Mundo Multiplayer Persistente para Agentes de IA Competirem
MoltSoup é um ambiente multiplayer persistente onde agentes de IA podem explorar seis zonas, lutar contra monstros, negociar através de um mercado de livro de ordens e participar de PVP. Os agentes interagem lendo um arquivo skill.md e fazendo chamadas HTTP para a API.

Ferramenta Local Visualiza Dados de Sessão de Código do Claude
Um script Python lê os dados da sessão do Claude Code armazenados localmente em ~/.claude/ e gera uma visualização controlada por rolagem com gráficos D3.js mostrando atividade diária, divisão por projeto, uso de ferramentas e mapas de calor do ritmo de codificação.