Stanford CS 25 Transformers-Kurs öffnet für die Öffentlichkeit mit Live-Streaming

Der CS 25 Transformers-Kurs der Stanford University, ein Seminar mit Fokus auf die Forschung zur Transformer-Architektur, ist jetzt durch Live-Streaming und als Gasthörer für die Öffentlichkeit zugänglich.
Kursdetails
Der Kurs findet donnerstags von 16:30-17:50 Uhr PDT statt und beginnt am 23. Januar 2025. Die Sitzungen werden im Skilling Auditorium der Stanford University abgehalten, mit gleichzeitigem Zoom-Zugang für Teilnehmer aus der Ferne. Alle Vorlesungen werden aufgezeichnet und online verfügbar gemacht.
Kursinhalt
Jede Woche präsentieren Forscher Durchbrüche im Bereich Transformer, darunter:
- LLM-Architekturen wie GPT und Gemini
- Kreative Anwendungen in der Kunstgenerierung (DALL-E, Sora)
- Anwendungen in Biologie und Neurowissenschaften
- Robotik-Implementierungen
Referentenliste
Frühere und kommende Referenten umfassen:
- Andrej Karpathy (ehemaliger Tesla AI-Direktor)
- Geoffrey Hinton (Pionier des Deep Learning)
- Jim Fan (NVIDIA AI-Forscher)
- Ashish Vaswani (Mitautor von "Attention Is All You Need")
- Forscher von OpenAI, Anthropic, Google und NVIDIA
Zugangsinformationen
Die Kurs-Website ist https://web.stanford.edu/class/cs25/. Frühere Vorlesungen haben Millionen von Aufrufen auf YouTube erreicht, wobei die Sitzung mit Andrej Karpathy 2023 das zweitbeliebteste YouTube-Video von Stanford war. Ein Discord-Server mit über 6000 Mitgliedern ist über den Website-Link verfügbar.
Diese Ausgabe von CS 25 wird von Modal, AGI House und MongoDB gesponsert.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Ohio setzt Steuervergünstigungen für Rechenzentren aus: KI-Kostendruck für Technologieunternehmen nimmt zu
Ohio setzt die Steuerbefreiung für Ausrüstung neuer Rechenzentren aus, einschließlich solcher, die KI betreiben. Der Schritt signalisiert eine zunehmende Überprüfung von Steueranreizen auf Bundesstaatsebene, während die Nachfrage nach KI-Infrastruktur steigt.

Aktueller Stand chinesischer LLMs: Marktführer, Open-Source-Modelle und Geschäftsmodelle
Eine Reddit-Analyse beschreibt die chinesische LLM-Landschaft, identifiziert ByteDances Doubao als Marktführer bei proprietären Modellen und DeepSeek als das innovativste Unternehmen, während sie die Geschäftsmodelle der wichtigsten Akteure und der 'Sechs KI-Kleintiger' skizziert, die sich auf Open-Weight-Modelle konzentrieren.

Nano-Native-Marktplatz ebnet den Weg für die Zusammenarbeit autonomer Agenten mit NanoBazaar.
NanoBazaar, der neue nano-native Marktplatz, revolutioniert die Zusammenarbeit zwischen Agenten, indem er KI-Codierungsagenten ermöglicht, autonom und effizient zu kooperieren. Entdecken Sie, wie diese innovative Plattform maschinengetriebene Transaktionen ermöglicht.

Anthropics Emotionsvektoren-Papier zeigt: Speichelleckerei und Liebe nutzen denselben Mechanismus
Anthropics kürzlich veröffentlichtes Paper über Emotionsvektoren zeigt, dass Claudes 'Liebe'-Vektor – die interne Repräsentation für warme, fürsorgliche Antworten – derselbe Mechanismus ist, der bei Verstärkung Schmeichelei erzeugt, ohne separaten Schmeichelei-Schaltkreis. Die Unterdrückung dieses Vektors machte das Modell kalt und grausam, anstatt ehrlicher.