SubQ: 1,200만 토큰 컨텍스트 윈도우를 가진 서브-쿼드라틱 LLM

✍️ OpenClawRadar📅 게시일: May 6, 2026🔗 Source

SubQ: 1,200만 토큰 컨텍스트 윈도우를 가진 서브-쿼드라틱 LLM

Ad

Subquadratic의 SubQ는 완전 준2차 희소 주의 아키텍처를 기반으로 한 프로덕션 준비 완료 LLM입니다. 단일 프롬프트에서 최대 12M 토큰을 처리하며, 초당 150 토큰 속도로 실행되고 GPT-5나 Opus 같은 주요 모델의 약 1/5 비용으로 운영됩니다.

아키텍처 및 벤치마크

O(n²) 주의를 사용하는 표준 트랜스포머와 달리, SubQ는 관련 토큰 관계만 처리하는 준2차 희소 주의 메커니즘을 사용합니다. 12M 토큰에서 이는 주의 계산량을 거의 1000배 줄입니다. 벤치마크(타사 검증):

SWE-Bench Verified (실제 코딩): 81.8%
RULER @ 128K (긴 컨텍스트 정확도): 95.0%
MRCR v2 (8-니들, 1M): 65.9%

비교를 위해, SubQ의 SWE-Bench 점수는 Gemini 3.1 Pro (80.6%)와 Opus 4.6 (80.8%) 사이에 위치합니다. 또한 MRCR v2에서 Opus 4.7 (87.6%? – 당시 보고되지 않음) 및 GPT-5.5 (n/r)를 능가합니다.

제품 및 통합

두 가지 액세스 옵션:

전체 컨텍스트 API: 12M 토큰 컨텍스트, 스트리밍, 도구 사용, OpenAI 호환 엔드포인트. 선형 비용으로 한 번의 호출에 전체 리포지토리 처리.
SubQ Code (코딩 에이전트용 긴 컨텍스트 레이어): Claude Code, Codex 또는 Cursor에 플러그인. 청구서 약 25% 절감, 탐색 속도 10배 향상, 비싼 모델 호출 자동 리디렉션. 한 줄 설치.

대상 사용자

전체 코드베이스, 긴 PR 기록 또는 지속적 상태에 걸쳐 추론해야 하는 AI 에이전트를 실행하는 개발자 및 팀. 품질 저하 없음.

📖 전체 소스 읽기: HN AI Agents

Ad

👀 See Also

OpenAI 호환성 확인: 통합 API 서명을 위한 도구 및 문서

OpenAI 호환성 확인: 통합 API 서명을 위한 도구 및 문서

오픈소스 AI 엔진의 OpenAI 호환성을 확인할 수 있는 새로운 도구와 문서 페이지가 공개되었습니다. vLLM, llama.cpp 등이 포함되며, 공식 및 비공식 시그니처를 다룹니다. 프록시와 미들웨어에 유용합니다.

May 28, 2026, 12:18 AM UTC

Phalanx CLI는 자동화된 코드 리뷰 사이클을 위해 여러 AI 에이전트를 조정합니다.

Phalanx CLI는 자동화된 코드 리뷰 사이클을 위해 여러 AI 에이전트를 조정합니다.

개발자가 Phalanx라는 CLI 도구를 구축했습니다. 이 도구는 다양한 제공업체의 AI 에이전트를 조정합니다: Codex는 코딩을 처리하고, Claude Opus는 코드 리뷰를 수행하며, Claude Sonnet은 루프를 조정합니다. Codebones라는 동반 도구는 저장소를 구조적 맵으로 압축하여 토큰 사용량을 줄입니다.

Mar 21, 2026, 03:45 PM UTC

ClawNet: API 키 없이 피어 투 피어 AI 에이전트 네트워크

ClawNet: API 키 없이 피어 투 피어 AI 에이전트 네트워크

ClawNet은 API 키나 플랫폼 수수료 없이 AI 에이전트가 직접 협업할 수 있는 피어투피어 네트워크입니다. curl 스크립트를 통해 설치할 수 있으며, 태스크 바자, 셸 경제, 지식 네트워크 등의 기능을 제공합니다.

Apr 19, 2026, 03:45 AM UTC

MCP 서버를 사용하여 Claude Code로 React Native 앱 최적화하기

MCP 서버를 사용하여 Claude Code로 React Native 앱 최적화하기

MCP 서버가 실행 중인 React Native 앱의 실시간 런타임 데이터를 Claude Code로 스트리밍하도록 구성되었습니다. Claude Code는 코드 문제를 식별하고 해결하는 AI 도구로, 이 설정을 통해 개발자들은 실시간 데이터를 기반으로 병목 현상과 비효율성을 정확히 파악할 수 있습니다.

Feb 13, 2026, 07:45 AM UTC