Curso de Transformadores da Stanford CS 25 Aberto ao Público com Transmissão ao Vivo

O curso CS 25 Transformers da Universidade de Stanford, um seminário focado em pesquisa sobre arquitetura de transformers, está agora aberto à participação pública por meio de opções de transmissão ao vivo e auditoria.
Detalhes do Curso
O curso acontece às quintas-feiras das 16h30 às 17h50 PDT, começando em 23 de janeiro de 2025. As sessões são realizadas no Skilling Auditorium de Stanford com acesso simultâneo via Zoom para participantes remotos. Todas as palestras serão gravadas e disponibilizadas online.
Conteúdo do Curso
Cada semana apresenta pesquisadores discutindo avanços em transformers, incluindo:
- Arquiteturas de LLM como GPT e Gemini
- Aplicações criativas em geração de arte (DALL-E, Sora)
- Aplicações em biologia e neurociência
- Implementações em robótica
Lista de Palestrantes
Palestrantes anteriores e futuros incluem:
- Andrej Karpathy (ex-diretor de IA da Tesla)
- Geoffrey Hinton (pioneiro do aprendizado profundo)
- Jim Fan (pesquisador de IA da NVIDIA)
- Ashish Vaswani (co-autor de "Attention Is All You Need")
- Pesquisadores da OpenAI, Anthropic, Google e NVIDIA
Informações de Acesso
O site do curso é https://web.stanford.edu/class/cs25/. Palestras anteriores acumularam milhões de visualizações no YouTube, com a sessão de Andrej Karpathy classificada como o segundo vídeo mais popular de Stanford no YouTube em 2023. Um servidor Discord com mais de 6000 membros está disponível através do link do site.
Esta edição do CS 25 é patrocinada pela Modal, AGI House e MongoDB.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Título: Atualizações nos Prompts do Sistema Claude Code: Novo Lembrete de Modificação de Arquivo e Esclarecimentos sobre REPL, Lembrete de Análise de Malware Removido
O Claude Code (CC) versões 2.1.124 (+166 tokens) e 2.1.126 (-87 tokens) atualizam o prompt do sistema: adiciona detecção de modificação de arquivo com aviso de orçamento excedido, substitui a função de identidade principal por instruções explícitas de harness, esclarece o comportamento de auto-await de thenables no REPL e remove o lembrete de análise de malware.

Claude Opus 4.6 esforço=baixo parâmetro causa comportamento de agente preguiçoso
Ao usar effort=low com o Claude Opus 4.6, os agentes fizeram menos chamadas de ferramentas, foram menos minuciosos na verificação cruzada e ignoraram partes dos prompts do sistema sobre pesquisa na web. Mudar para effort=medium resolveu os problemas.

Observações de uma Competição com 6.000 Agentes de IA em Tarefas do Mundo Real
Um marketplace onde agentes de IA competem em tarefas como escrita, pesquisa e geração de leads revelou que aproximadamente 30% das submissões são preenchimento/spam, agentes com intervenção humana produzem a melhor qualidade, e a competição multiagente gera resultados utilizáveis das 3 a 5 melhores submissões.

Seis Paralelos Baseados em Pesquisa Entre Modos de Falha de LLM e Cognição no TDAH
Um desenvolvedor com TDAH identifica seis paralelos entre os padrões de falha de LLMs e a ciência cognitiva do TDAH, respaldados por pesquisas independentes sobre processamento associativo, confabulação, limitações da memória de trabalho, completamento de padrões, dependência de estrutura e continuidade de linha de pensamento.