Qwen3.6-27Bが単一の24GB GPUに収まり、SWE-benchで以前の397B MoEを上回る性能を達成

Qwen3.6-27Bが4月22日にリリースされました。これは27Bの高密度モデルで、Q4_K_M(約16.8GB)で1つの24GB GPUに収まり、SWE-bench Verifiedで77.2のスコアを記録し、以前の397B MoEモデル(76.2)を上回っています。コンシューマーハードウェアでローカルコーディングエージェントを実行する開発者にとって、これは有能なエージェントモデルの敷居を変えるものです。
主な仕様とアーキテクチャ
- 262Kコンテキスト長
- Apache 2.0ライセンス
- Gated DeltaNet線形注意機構(4つのサブレイヤーのうち3つ)と残りにGated Attention
- Thinking Preservationにより、ターン間で推論トレースを引き継ぎ、冗長なトークン生成を削減し、長いエージェントセッションでのKVキャッシュ効率を向上
ハードウェア要件
Q4_K_Mでは、モデルは約16.8GBのVRAMを使用し、1枚の24GBカード(例:RTX 3090/4090、A10G)に快適に収まります。対照的に、Qwen3-Coder-Next(80B MoE、3Bアクティブ)では、同じ量子化で45〜80GB必要であり、デュアルGPUセットアップまたは48GB以上のユニファイドメモリを搭載したApple Siliconに制限されます。
注意点と落とし穴
- CUDA 13.2は使用しないでください。出力がガタガタになります。CUDA 13.1または12.xを使用してください。
- すでに48GB以上のハードウェアでエージェントタスク用にCoder-Nextを実行しているユーザーにとって、切り替えは明らかに有益ではありません。
- 古いまたは性能の低いローカルコーディングモデルで行き詰まっているシングルGPUユーザーにとって、Qwen3.6-27Bは現在、24GBクラスで最も有能なオプションです。
📖 出典全文: r/LocalLLaMA
👀 See Also

なぜある開発者がコミットにAI共同作成者タグを残すのか
ある開発者が、Gitコミットに意図的に「Co-Authored-by: Claude」を含める理由を説明し、写真撮影におけるEXIFデータとの類似性を指摘しながら、AI支援による精密なコード変更の課題について論じています。

Claude Code v2.1.145: JSONエージェント一覧、OTELスパン修正、セキュリティパッチなど
Claude Code v2.1.145 は、スクリプト用の `claude agents --json` を追加、権限プロンプトのバイパスを修正、OTEL スパンを改善し、その他多数の機能強化を実現。

Anthropicは、OpenClawを含むサードパーティ製ハーネスでのClaudeサブスクリプション利用を制限しています。
Anthropicは、4月4日午後12時(太平洋時間)/午後8時(BST)から、Claudeのサブスクリプション制限をOpenClawなどのサードパーティ製ハーネスで使用できなくなると発表しました。ユーザーはこれらの統合に別途従量課金を有効にして追加利用を行う必要があります。

AIとデータセンターが牽引する米国の電力需要、2026~2027年に過去最高へ
米国エネルギー情報局(EIA)は、AIワークロードとデータセンターの拡大を主な要因として、2026~2027年に電力消費が過去最高を記録するとの予測を発表した。