SubQ: 1,200万トークンのコンテキストウィンドウを備えた準二次LLM

✍️ OpenClawRadar📅 公開日: May 6, 2026🔗 Source
SubQ: 1,200万トークンのコンテキストウィンドウを備えた準二次LLM
Ad

Subquadratic社のSubQは、完全に準二次スパース注意機構をベースにしたプロダクション対応LLMです。単一プロンプトで最大1200万トークンを処理し、毎秒150トークンの速度で動作し、GPT-5やOpusなどの主要モデルと比較して約5分の1のコストです。

アーキテクチャとベンチマーク

O(n²)の注意機構を持つ標準的なトランスフォーマーとは異なり、SubQは準二次スパース注意機構を採用し、関連するトークン関係のみを処理します。1200万トークンでは、注意計算を約1000倍削減します。ベンチマーク(第三者検証済み):

  • SWE-Bench Verified(実世界のコーディング): 81.8%
  • RULER @ 128K(長文コンテキスト精度): 95.0%
  • MRCR v2(8ニードル、100万トークン): 65.9%

比較として、SubQのSWE-BenchスコアはGemini 3.1 Pro(80.6%)とOpus 4.6(80.8%)の間に位置します。また、MRCR v2ではOpus 4.7(87.6%?—当時未報告)やGPT-5.5(未報告)を上回っています。

製品と統合

2つのアクセスオプション:

  • Full-Context API: 1200万トークンのコンテキスト、ストリーミング、ツール使用、OpenAI互換エンドポイント。リポジトリ全体を1回の呼び出しで線形コストで処理。
  • SubQ Code(コーディングエージェント用の長文コンテキストレイヤー): Claude Code、Codex、Cursorにプラグイン。請求額約25%削減、探索速度10倍向上、高価なモデル呼び出しを自動リダイレクト。一行でインストール。

対象ユーザー

コードベース全体、長いPR履歴、または永続的な状態を品質低下なく推論する必要があるAIエージェントを実行する開発者やチーム。

📖 出典: HN AI Agents

Ad

👀 See Also

ローカル・クラウドハイブリッドAIアーキテクチャ:r/LocalLLaMAに触発された実践パターン
Tools

ローカル・クラウドハイブリッドAIアーキテクチャ:r/LocalLLaMAに触発された実践パターン

元の投稿では、ローカルモデルが日常的なタスクを処理し、複雑な推論が必要な場合は単一のAPI呼び出しでクラウドモデルに委譲するハイブリッドAIモデルを提案しています。さらに、ガードレールとして決定論的な「ハイパーバイザー」を併用します。

OpenClawRadar
ブリッツ:App Store提出用のClaudeコードツール
Tools

ブリッツ:App Store提出用のClaudeコードツール

Blitzは、Claude CodeにApp Storeへの提出をMCPツールコールで自動化する機能を提供する無料ツールです。ユーザーはClaudeに「私のアプリをApp Storeに提出して」と依頼することで、証明書、スクリーンショット、App Store Connectフォームの処理を任せることができます。

OpenClawRadar
Creation OS:モデルが幻覚ではなく「わからない」と言えるようにするローカルσゲートLLMランタイム
Tools

Creation OS:モデルが幻覚ではなく「わからない」と言えるようにするローカルσゲートLLMランタイム

Creation OSは、ローカルLLM(BitNet、Qwen、Gemma、任意のGGUF)をσゲートでラップし、複数の不確実性チャネルを測定して出力ごとにACCEPT、RETHINK、ABSTAINを決定します。クラウドもAPIも不要。TruthfulQAの精度は選択的再生成により約29%向上しました。

OpenClawRadar
2025年4月15日~5月3日 トップ6のオープンソースClaudeスキル
Tools

2025年4月15日~5月3日 トップ6のオープンソースClaudeスキル

過去15日間の6つのオープンソースClaudeスキル:ブランドアルケミー、npm-downloads-to-leads、hyperframes、email-newsletter、pricingなど。各スキルの機能を詳しく解説。

OpenClawRadar