SubQ: 1,200万トークンのコンテキストウィンドウを備えた準二次LLM

Subquadratic社のSubQは、完全に準二次スパース注意機構をベースにしたプロダクション対応LLMです。単一プロンプトで最大1200万トークンを処理し、毎秒150トークンの速度で動作し、GPT-5やOpusなどの主要モデルと比較して約5分の1のコストです。
アーキテクチャとベンチマーク
O(n²)の注意機構を持つ標準的なトランスフォーマーとは異なり、SubQは準二次スパース注意機構を採用し、関連するトークン関係のみを処理します。1200万トークンでは、注意計算を約1000倍削減します。ベンチマーク(第三者検証済み):
- SWE-Bench Verified(実世界のコーディング): 81.8%
- RULER @ 128K(長文コンテキスト精度): 95.0%
- MRCR v2(8ニードル、100万トークン): 65.9%
比較として、SubQのSWE-BenchスコアはGemini 3.1 Pro(80.6%)とOpus 4.6(80.8%)の間に位置します。また、MRCR v2ではOpus 4.7(87.6%?—当時未報告)やGPT-5.5(未報告)を上回っています。
製品と統合
2つのアクセスオプション:
- Full-Context API: 1200万トークンのコンテキスト、ストリーミング、ツール使用、OpenAI互換エンドポイント。リポジトリ全体を1回の呼び出しで線形コストで処理。
- SubQ Code(コーディングエージェント用の長文コンテキストレイヤー): Claude Code、Codex、Cursorにプラグイン。請求額約25%削減、探索速度10倍向上、高価なモデル呼び出しを自動リダイレクト。一行でインストール。
対象ユーザー
コードベース全体、長いPR履歴、または永続的な状態を品質低下なく推論する必要があるAIエージェントを実行する開発者やチーム。
📖 出典: HN AI Agents
👀 See Also

ローカル・クラウドハイブリッドAIアーキテクチャ:r/LocalLLaMAに触発された実践パターン
元の投稿では、ローカルモデルが日常的なタスクを処理し、複雑な推論が必要な場合は単一のAPI呼び出しでクラウドモデルに委譲するハイブリッドAIモデルを提案しています。さらに、ガードレールとして決定論的な「ハイパーバイザー」を併用します。

ブリッツ:App Store提出用のClaudeコードツール
Blitzは、Claude CodeにApp Storeへの提出をMCPツールコールで自動化する機能を提供する無料ツールです。ユーザーはClaudeに「私のアプリをApp Storeに提出して」と依頼することで、証明書、スクリーンショット、App Store Connectフォームの処理を任せることができます。

Creation OS:モデルが幻覚ではなく「わからない」と言えるようにするローカルσゲートLLMランタイム
Creation OSは、ローカルLLM(BitNet、Qwen、Gemma、任意のGGUF)をσゲートでラップし、複数の不確実性チャネルを測定して出力ごとにACCEPT、RETHINK、ABSTAINを決定します。クラウドもAPIも不要。TruthfulQAの精度は選択的再生成により約29%向上しました。

2025年4月15日~5月3日 トップ6のオープンソースClaudeスキル
過去15日間の6つのオープンソースClaudeスキル:ブランドアルケミー、npm-downloads-to-leads、hyperframes、email-newsletter、pricingなど。各スキルの機能を詳しく解説。