El Curso de Transformadores CS25 de Stanford se Abre al Público con Transmisión en Vivo

El curso CS 25 Transformers de la Universidad de Stanford, un seminario centrado en la investigación de la arquitectura de transformadores, ahora está abierto a la participación pública a través de opciones de transmisión en vivo y auditoría.
Detalles del Curso
El curso se imparte los jueves de 4:30 a 5:50 p. m. PDT, comenzando el 23 de enero de 2025. Las sesiones se llevan a cabo en el Auditorio Skilling de Stanford con acceso simultáneo por Zoom para participantes remotos. Todas las conferencias se grabarán y pondrán a disposición en línea.
Contenido del Curso
Cada semana presenta a investigadores discutiendo avances en transformadores, incluyendo:
- Arquitecturas de LLM como GPT y Gemini
- Aplicaciones creativas en generación de arte (DALL-E, Sora)
- Aplicaciones en biología y neurociencia
- Implementaciones en robótica
Lista de Oradores
Oradores anteriores y próximos incluyen:
- Andrej Karpathy (exdirector de IA de Tesla)
- Geoffrey Hinton (pionero del aprendizaje profundo)
- Jim Fan (investigador de IA de NVIDIA)
- Ashish Vaswani (coautor de "Attention Is All You Need")
- Investigadores de OpenAI, Anthropic, Google y NVIDIA
Información de Acceso
El sitio web del curso es https://web.stanford.edu/class/cs25/. Las conferencias anteriores han acumulado millones de visitas en YouTube, con la sesión de Andrej Karpathy clasificada como el segundo video más popular de Stanford en YouTube en 2023. Un servidor de Discord con más de 6000 miembros está disponible a través del enlace del sitio web.
Esta iteración de CS 25 está patrocinada por Modal, AGI House y MongoDB.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Claude Code v2.1.152: /code-review --fix, plugin desactivado, hook MessageDisplay
Claude Code v2.1.152 introduce /code-review --fix para aplicar sugerencias a tu árbol de trabajo, /reload-skills, hook MessageDisplay y herramientas no permitidas en plugins en frontmatter. También corrige la degradación del estilo en sesiones largas, deduplicación MCP y reporte de caché.

Diagnósticos de Caché de Mensajes de Claude: Hilo de Estadísticas Revela una Tasa de Lectura de Caché del 98.9%
Hace dos días, Claude lanzó diagnósticos de caché de prompts en Console. Un desarrollador reporta una tasa de lectura de caché del 98.9%, con el 80% de los fallos debidos a cambios en los mensajes.

Limitaciones del reconocimiento de voz de Claude y solución alternativa del usuario con Spokenly y Parakeet TDT
Un usuario reporta que la transcripción por micrófono integrada de Claude es imprecisa en comparación con la de ChatGPT, generando más trabajo del que ahorra. Implementaron una solución alternativa usando Spokenly en Mac con el modelo Parakeet TDT de NVIDIA para un mejor rendimiento.

Debate MCP vs Habilidades: Comprender los Roles y el Verdadero Problema de la Degradación del Contexto
Una publicación de Reddit aclara que MCP proporciona herramientas, autenticación y dirección de contexto para agentes de IA, mientras que las Habilidades son prompts reutilizables que definen el comportamiento del agente. El autor argumenta que ambos son necesarios e identifica la degradación del contexto como un problema crítico donde los agentes olvidan instrucciones.