El Curso de Transformadores CS25 de Stanford se Abre al Público con Transmisión en Vivo

El curso CS 25 Transformers de la Universidad de Stanford, un seminario centrado en la investigación de la arquitectura de transformadores, ahora está abierto a la participación pública a través de opciones de transmisión en vivo y auditoría.
Detalles del Curso
El curso se imparte los jueves de 4:30 a 5:50 p. m. PDT, comenzando el 23 de enero de 2025. Las sesiones se llevan a cabo en el Auditorio Skilling de Stanford con acceso simultáneo por Zoom para participantes remotos. Todas las conferencias se grabarán y pondrán a disposición en línea.
Contenido del Curso
Cada semana presenta a investigadores discutiendo avances en transformadores, incluyendo:
- Arquitecturas de LLM como GPT y Gemini
- Aplicaciones creativas en generación de arte (DALL-E, Sora)
- Aplicaciones en biología y neurociencia
- Implementaciones en robótica
Lista de Oradores
Oradores anteriores y próximos incluyen:
- Andrej Karpathy (exdirector de IA de Tesla)
- Geoffrey Hinton (pionero del aprendizaje profundo)
- Jim Fan (investigador de IA de NVIDIA)
- Ashish Vaswani (coautor de "Attention Is All You Need")
- Investigadores de OpenAI, Anthropic, Google y NVIDIA
Información de Acceso
El sitio web del curso es https://web.stanford.edu/class/cs25/. Las conferencias anteriores han acumulado millones de visitas en YouTube, con la sesión de Andrej Karpathy clasificada como el segundo video más popular de Stanford en YouTube en 2023. Un servidor de Discord con más de 6000 miembros está disponible a través del enlace del sitio web.
Esta iteración de CS 25 está patrocinada por Modal, AGI House y MongoDB.
📖 Read the full source: r/LocalLLaMA
👀 Ver también
Referencia de Opus 4.7 sobre el esfuerzo de razonamiento: el nivel medio supera al alto y al máximo en tareas reales
En 29 tareas del repositorio GraphQL-go-tools, Opus 4.7 en Claude Code alcanza su punto máximo con esfuerzo de razonamiento medio — las configuraciones más altas degradan la corrección y aumentan el costo sin mejorar la calidad del parche.

Comparación de referencia de Qwen3.6 Plus con modelos SOTA occidentales
Qwen3.6 Plus obtiene 78.8 en SWE-bench Verified, 90.4 en GPQA/GPQA Diamond, 28.8 en HLE (sin herramientas) y 78.8 en MMMU-Pro, posicionándose de manera competitiva frente a modelos como GPT-5.4, Claude Opus 4.6 y Gemini 3.1 Pro Preview.

Claude Opus 4.6 bloquea el flujo de trabajo de la competencia de Kaggle para la revisión de código.
Un desarrollador informa que Claude Opus 4.6 ahora está bloqueando flujos de trabajo legítimos de competencias de Kaggle, donde Claude audita trazas de razonamiento para la validación de datos de entrenamiento SFT. El usuario estaba trabajando en el NVIDIA Nemotron Reasoning Challenge cuando los filtros de seguridad marcaron ejemplos de cifrado por sustitución.

Dos funcionarios sudafricanos de Asuntos de Interior suspendidos por alucinaciones de IA en un documento de política
Dos funcionarios fueron suspendidos después de que se encontraran alucinaciones de IA en la lista de referencias de un libro blanque revisado sobre ciudadanía, inmigración y protección de refugiados. El departamento implementará controles de IA y revisará todos los documentos políticos desde noviembre de 2022.