O projeto de autoresearch de Karpathy: agentes de IA executam experimentos de treinamento de LLM durante a noite.

O que o projeto de autoresearch de Karpathy faz
Andrej Karpathy lançou um pequeno repositório chamado "autoresearch" que demonstra o conceito de "pesquisador de IA em loop". O sistema usa um agente de IA para executar autonomamente experimentos de treinamento de LLM durante a noite em uma única GPU.
Como funciona
O agente segue este fluxo de trabalho:
- Edita continuamente o arquivo
train.py - Executa experimentos de treinamento nanochat de 5 minutos
- Verifica se a métrica de bits por byte de validação (
val_bpb) melhorou - Repete este ciclo enquanto você dorme
Configuração e instalação
O projeto tem uma configuração super minimalista:
- Hardware: Uma GPU
- Arquivos: Um arquivo principal
- Métricas: Uma métrica principal (
val_bpb)
O humano escreve o prompt de organização da pesquisa em program.md, e o agente cuida da iteração do código.
Taxa de experimentos
Com um orçamento fixo de 5 minutos por experimento, o sistema pode executar aproximadamente 12 experimentos por hora.
Esta abordagem demonstra uma implementação prática de pesquisa automatizada onde agentes de IA podem explorar espaços de parâmetros e configurações de treinamento de forma autônoma, potencialmente acelerando ciclos de experimentação para desenvolvedores que trabalham com modelos de linguagem.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Dois Ferramentas MCP para Claude Code: Validação de Ideia e Memória do Agente de Negociação
Um desenvolvedor criou duas ferramentas MCP para Claude Code: idea-reality-mcp verifica o GitHub e o Hacker News antes de programar para evitar duplicatas, enquanto tradememory-protocol fornece memória para agentes de IA de trading armazenarem negociações com contexto e acompanharem o desempenho da estratégia. Ambas são de código aberto e estão disponíveis no PyPI.

Graph Compose: Fluxos de Trabalho Temporais Hospedados com Construtor Visual e IA
Graph Compose é uma plataforma hospedada para orquestrar fluxos de trabalho de API no Temporal, permitindo que você defina fluxos de trabalho como gráficos JSON com três métodos de construção: um construtor visual React Flow, um SDK TypeScript e um assistente de IA que converte inglês simples em gráficos.

Desenvolvedor compartilha mais de 10 servidores MCP para liquidação de agentes de IA, reputação e micropagamentos
Um desenvolvedor construiu o BlindOracle no Claude Code com mais de 100 agentes e criou mais de 10 servidores MCP para liquidação, reputação e micropagamentos. A arquitetura inclui previsões privadas de commit-reveal, pontuação on-chain, micropagamentos por solicitação e atestado verificável de agentes.

Vibe Hosting: Integração MCP do Claude Code para Implantação Assistida por IA
A plataforma Vibe Hosting da NameOcean integra o Claude Code MCP para construir e implantar projetos por meio de comandos em linguagem natural. O serviço oferece SSL gratuito, domínios, DNS e configuração de VPS para sites estáticos e aplicações Node.js, Python, Django e Go.