El proyecto de autorinvestigación de Karpathy: agentes de IA ejecutan experimentos de entrenamiento de LLM durante la noche.

✍️ OpenClawRadar📅 Publicado: 9 de marzo de 2026🔗 Source

Qué hace el proyecto de autorinvestigación de Karpathy

Andrej Karpathy lanzó un pequeño repositorio llamado "autoresearch" que demuestra el concepto de "investigador de IA en bucle". El sistema utiliza un agente de IA para ejecutar autónomamente experimentos de entrenamiento de LLM durante la noche en una sola GPU.

Cómo funciona

El agente sigue este flujo de trabajo:

Edita continuamente el archivo train.py
Ejecuta experimentos de entrenamiento nanochat de 5 minutos
Verifica si la métrica de bits por byte de validación (val_bpb) mejoró
Repite este ciclo mientras duermes

Configuración e instalación

El proyecto tiene una configuración súper minimalista:

Hardware: Una GPU
Archivos: Un archivo principal
Métricas: Una métrica principal (val_bpb)

El humano escribe el prompt de organización de investigación en program.md, y el agente maneja la iteración del código.

Rendimiento de experimentos

Con un presupuesto fijo de 5 minutos por experimento, el sistema puede ejecutar aproximadamente 12 experimentos por hora.

Este enfoque demuestra una implementación práctica de investigación automatizada donde los agentes de IA pueden explorar espacios de parámetros y configuraciones de entrenamiento de forma autónoma, potencialmente acelerando los ciclos de experimentación para desarrolladores que trabajan con modelos de lenguaje.

📖 Leer la fuente completa: r/LocalLLaMA

👀 Ver también

Herramientas

¿Por qué una única herramienta run() con comandos Unix supera a la llamada de funciones para agentes de IA?

Un líder de backend con dos años de experiencia en la creación de agentes argumenta que una única herramienta run(command="...") con comandos CLI al estilo Unix supera a los catálogos tradicionales de llamadas a funciones. El enfoque aprovecha la familiaridad existente de los LLM con los comandos de shell a partir de sus datos de entrenamiento.

12 mar 2026, 09:45 UTC

OpenClawRadar

Herramientas

LamBench: Un conjunto de pruebas de referencia de cálculo lambda para agentes de codificación de IA

LamBench es un conjunto de pruebas de referencia que evalúa agentes de IA en tareas de cálculo lambda, midiendo inteligencia, velocidad y elegancia. La versión v1 incluye problemas y una matriz de puntuaciones.

25 abr 2026, 16:15 UTC

OpenClawRadar

Herramientas

Optio: Orquestrando Agentes de Codificación con IA en Kubernetes desde el Ticket hasta la PR

Optio es un sistema de orquestación de código abierto que convierte tickets en solicitudes de extracción fusionadas utilizando agentes de codificación con IA como Claude Code o Codex. Maneja el ciclo de vida completo en pods de Kubernetes aislados con un bucle de retroalimentación que reanuda automáticamente a los agentes en fallos de CI o comentarios de revisión.

26 mar 2026, 09:45 UTC

OpenClawRadar

Herramientas

Automatiza las reuniones diarias en podcasts personales de Spotify con OpenClaw y la CLI de Save to Spotify

OpenClaw se ejecuta diariamente a las 7 a.m., extrae hilos de Slack + notificaciones de GitHub + calendario, los resume en mp3 y los sube como un episodio privado mediante la CLI Save to Spotify. Funciona en Free y Premium.

9 may 2026, 20:15 UTC

OpenClawRadar