스탠퍼드 CS 25 트랜스포머 강좌, 실시간 스트리밍으로 공개 강좌 개설

스탠퍼드 대학교의 CS 25 트랜스포머 과정은 트랜스포머 아키텍처 연구에 초점을 맞춘 세미나로, 이제 라이브 스트리밍 및 청강 옵션을 통해 일반인도 참여할 수 있습니다.
과정 세부 정보
이 과정은 2025년 1월 23일부터 매주 목요일 오후 4시 30분부터 5시 50분(태평양 표준시)까지 진행됩니다. 세션은 스탠퍼드 대학교의 스킬링 강당에서 열리며, 원격 참가자를 위한 줌 접속도 동시에 제공됩니다. 모든 강의는 녹화되어 온라인에 공개됩니다.
과정 내용
매주 연구자들이 트랜스포머의 획기적인 발전에 대해 논의하며, 그 내용은 다음과 같습니다:
- GPT 및 제미니와 같은 LLM 아키텍처
- 예술 생성(DALL-E, Sora)에서의 창의적 응용
- 생물학 및 신경과학 응용
- 로봇공학 구현
연사 라인업
이전 및 예정된 연사는 다음과 같습니다:
- 안드레이 카파시(전 테슬라 AI 디렉터)
- 제프리 힌턴(딥러닝 선구자)
- 짐 팬(NVIDIA AI 연구원)
- 아시시 바스와니('Attention Is All You Need' 공동 저자)
- OpenAI, Anthropic, Google, NVIDIA의 연구자들
접속 정보
과정 웹사이트는 https://web.stanford.edu/class/cs25/입니다. 이전 강의는 YouTube에서 수백만 회의 조회수를 기록했으며, 안드레이 카파시 세션은 2023년 스탠퍼드 대학교의 두 번째로 인기 있는 YouTube 동영상으로 선정되었습니다. 웹사이트 링크를 통해 6000명 이상의 회원이 있는 디스코드 서버를 이용할 수 있습니다.
이번 CS 25 과정은 Modal, AGI House, MongoDB의 후원을 받습니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

RTX 4090 vs H100: Llama-3-8B 파인튜닝 비용 대비 성능 비교
한 개발자가 RTX 4090과 임대한 H100 인스턴스 모두에서 Llama-3-8B 파인튜닝을 테스트했습니다. 4090 설정은 선불로 2,000달러가 들었고 24시간이 걸렸으며, H100 임대는 약 80달러가 들었고 4시간 만에 완료되었습니다.

클로드 AI, QGIS 워크플로우에서 'Sketcher' 용어 반복 버그 보여
사용자가 DXF 파일 정렬에 대한 QGIS 안내를 제공할 때 Claude AI가 반복적으로 '스케처'라는 단어를 출력한다고 보고했으며, 이는 특정 용어에 대한 모델 버그 가능성을 시사합니다. 출처에는 좌표계 정렬을 위한 실용적인 QGIS 워크플로우 세부사항이 포함되어 있습니다.

2026년 LLM API 비용 비교: 자체 호스팅 vs. 클라우드 제공업체
레딧 사용자가 11개 제공업체의 1백만 토큰/일 LLM API 비용을 비교한 결과, vLLM을 사용한 자체 호스팅 비용은 1백만 토큰당 약 $0.05인 반면 GPT-4o는 입력/출력 토큰당 $5/$15로 나타났습니다.

ETH 취리히 연구, AI 코딩 에이전트를 위한 AGENTS.md 파일의 가치에 의문 제기
ETH 취리히의 새로운 연구에 따르면, LLM이 생성한 AGENTS.md 파일은 AI 에이전트의 작업 성공률을 3% 감소시키고 추론 비용을 20% 이상 증가시키는 반면, 인간이 작성한 파일은 유사한 비용 증가와 함께 4%의 미미한 성능 향상만 제공합니다.