O projeto de autoresearch de Karpathy: agentes de IA executam experimentos de treinamento de LLM durante a noite.

✍️ OpenClawRadar📅 Publicado: March 9, 2026🔗 Source

O que o projeto de autoresearch de Karpathy faz

Andrej Karpathy lançou um pequeno repositório chamado "autoresearch" que demonstra o conceito de "pesquisador de IA em loop". O sistema usa um agente de IA para executar autonomamente experimentos de treinamento de LLM durante a noite em uma única GPU.

Como funciona

O agente segue este fluxo de trabalho:

Edita continuamente o arquivo train.py
Executa experimentos de treinamento nanochat de 5 minutos
Verifica se a métrica de bits por byte de validação (val_bpb) melhorou
Repete este ciclo enquanto você dorme

Configuração e instalação

O projeto tem uma configuração super minimalista:

Hardware: Uma GPU
Arquivos: Um arquivo principal
Métricas: Uma métrica principal (val_bpb)

O humano escreve o prompt de organização da pesquisa em program.md, e o agente cuida da iteração do código.

Taxa de experimentos

Com um orçamento fixo de 5 minutos por experimento, o sistema pode executar aproximadamente 12 experimentos por hora.

Esta abordagem demonstra uma implementação prática de pesquisa automatizada onde agentes de IA podem explorar espaços de parâmetros e configurações de treinamento de forma autônoma, potencialmente acelerando ciclos de experimentação para desenvolvedores que trabalham com modelos de linguagem.

📖 Leia a fonte completa: r/LocalLLaMA

👀 See Also

Tools

Org Studio: Painel de código aberto para gerenciar equipes de IA multiagente

Org Studio é um painel de código aberto que aplica princípios de design organizacional para coordenar equipes de agentes de IA, com suporte nativo para os tempos de execução do OpenClaw e do Hermes Agent. Ele apresenta gerenciamento de topologia de equipe, quadros de tarefas orientados por eventos e comunicação entre tempos de execução, onde os agentes podem mencionar uns aos outros nos comentários das tarefas.

Apr 16, 2026, 02:45 AM UTC

OpenClawRadar

Tools

Deblank: Ferramenta para Remover Formatação de Código para Redução de Tokens em LLM

Deblank é uma ferramenta de código aberto que remove a formatação de código (indentação, espaços em branco, quebras de linha) antes de enviar para LLMs, reduzindo tokens em ~30% para Java/C++ e ~9% para Python com latência de ~76ms. Ele suporta Python, Java, C/C++, C#, JS/TS e Go.

Mar 23, 2026, 05:45 AM UTC

OpenClawRadar

Tools

Claude Code v2.1.59 adiciona memória automática, comando de cópia e melhorias no shell.

Claude Code v2.1.59 introduz o salvamento automático de contexto para a memória automática com gerenciamento /memory, adiciona um comando /copy para seleção interativa de blocos de código e melhora as sugestões de prefixo para comandos bash compostos.

Feb 26, 2026, 03:45 AM UTC

OpenClawRadar

Tools

Servidor MCP do Gmail de código aberto adiciona suporte a múltiplas contas e acesso de escrita

Um servidor MCP de código aberto permite que o Claude AI se conecte a várias contas do Gmail com capacidades completas de leitura e escrita, incluindo funcionalidades de arquivamento, rotulagem e cancelamento automático de inscrições. Ele suporta a sintaxe de pesquisa do Gmail e pode ser implantado no Railway em 5 minutos ou hospedado localmente.

Apr 14, 2026, 08:45 AM UTC

OpenClawRadar