서브쿼드라틱, AI 모델용 1200만 토큰 컨텍스트 윈도우 공개

Subquadratic가 1,200만 토큰 컨텍스트 윈도우를 발표하며 subquadratic 어텐션 메커니즘의 획기적인 발전을 주장했습니다. 이는 현재 모델의 일반적인 128K~1M 토큰 윈도우와 비교됩니다. 이 기술은 모델이 계산이나 메모리의 제곱 스케일링 없이 훨씬 더 큰 컨텍스트를 처리할 수 있게 합니다.
주요 세부 사항
- 컨텍스트 윈도우: 1,200만 토큰 (GPT-4의 128K 토큰보다 12배 큼)
- subquadratic 어텐션 기반, 시퀀스 길이에 대해 선형 또는 거의 선형 복잡도를 사용할 가능성
- 단일 순방향 패스로 전체 대규모 코드베이스, 긴 문서 또는 여러 시간 분량의 비디오 대본 처리 가능
- 잠재적 응용: 전체 저장소 코드 리뷰, 긴 문서 분석, 전체 기록을 포함한 다중 턴 대화
- 드롭인 어텐션 교체를 통해 기존 트랜스포머 기반 LLM과 호환 가능
이 접근 방식은 상태 공간 모델이나 저랭크 분해와 같은 기술을 사용하여 O(n²) 어텐션을 거의 O(n)으로 줄입니다. 소스에는 특정 벤치마크 수치가 제공되지 않았지만, 단일 GPU에서 1,200만 토큰 윈도우를 실용적으로 만든다는 주장입니다.
대상
코드 분석, 문서 처리 또는 값비싼 청킹이나 검색 없이 긴 컨텍스트 이해가 필요한 모든 작업을 하는 AI 엔지니어.
📖 전체 소스 읽기: HN AI Agents
👀 See Also

클로드 데일리 다이제스트: /dream 기능 출시, 사용 제한에 대한 반발, 접근성 도구
Anthropic은 Claude의 자동 메모리 시스템을 위한 /dream 기능을 출시했으며, 커뮤니티에서는 사용량 제한에 대한 불만이 제기되고 있습니다. 한 청각 장애 개발자는 Claude Code용 터미널 플래시 알림 플러그인을 제작했습니다.

클로드 AI, QGIS 워크플로우에서 'Sketcher' 용어 반복 버그 보여
사용자가 DXF 파일 정렬에 대한 QGIS 안내를 제공할 때 Claude AI가 반복적으로 '스케처'라는 단어를 출력한다고 보고했으며, 이는 특정 용어에 대한 모델 버그 가능성을 시사합니다. 출처에는 좌표계 정렬을 위한 실용적인 QGIS 워크플로우 세부사항이 포함되어 있습니다.

클로드의 음성 인식 한계와 사용자들의 Spokenly 및 Parakeet TDT를 활용한 해결 방법
사용자가 Claude의 내장 마이크 음성 인식이 ChatGPT에 비해 부정확하다고 보고하며, 이로 인해 절약되는 노력보다 더 많은 작업이 발생한다고 말합니다. 그들은 Mac에서 Spokenly와 NVIDIA의 Parakeet TDT 모델을 사용하여 성능을 개선하는 임시 해결책을 구현했습니다.

러버블은 국제 여성의 날을 기념하여 24시간 무료 이용과 파트너 크레딧 350달러를 제공합니다.
Lovable은 24시간 무료 빌딩 접근권과 함께 Anthropic의 Claude API 토큰 $100, Stripe 처리 수수료 크레딧 $250을 제공합니다. 이 혜택은 3월 9일 오전 12시 59분에 종료됩니다.