ステップ3.5フラッシュの探求:高速深層推論のためのオープンソースモデル

✍️ OpenClawRadar📅 公開日: February 19, 2026🔗 Source
ステップ3.5フラッシュの探求:高速深層推論のためのオープンソースモデル
Ad

Step 3.5 Flashは、高速かつ信頼性の高い深層推論能力を提供することに焦点を当てたオープンソースの基盤モデルです。スパースなMixture of Experts(MoE)アーキテクチャを採用し、トークンごとに1960億パラメータのうち110億パラメータのみを活性化します。この選択的な活性化により高い「知能密度」を実現し、トップクラスの独自モデルと競争できる性能を維持しながら、リアルタイムのインタラクションにも俊敏に対応できます。

深層推論と速度

このモデルは3方向マルチトークン予測(MTP-3)を組み込んでおり、1秒あたり100から300トークンを処理し、シングルストリームのコーディングタスクでは最大350トークンに達します。これは、迅速な応答性を伴う複雑な多段階推論に理想的です。

コーディングとエージェントタスクでの性能

Step 3.5 Flashは、継続的な自己改善を保証するスケーラブルな強化学習フレームワークによってサポートされたエージェントタスクで優れた性能を発揮します。SWE-bench Verifiedベンチマークで74.4%、Terminal-Bench 2.0で51.0%のスコアを達成し、洗練された長期的タスクを処理する能力を示しています。

効率的な長文脈処理

3:1のスライディングウィンドウアテンション(SWA)比率を使用して、大規模な256Kの文脈ウィンドウをサポートし、各フルアテンションレイヤーに対して3つのSWAレイヤーを統合しています。この方法は、従来の長文脈モデルと比較して計算オーバーヘッドを大幅に削減します。

ローカル展開とアクセシビリティ

簡単なローカル展開を想定して設計されたStep 3.5 Flashは、Mac Studio M4 MaxやNVIDIA DGX Sparkなどの高性能コンシューマーハードウェア上で安全に実行でき、性能を損なうことなくデータのプライバシーを確保します。

📖 完全なソースを読む: HN AI Agents

Ad

👀 See Also

AIコーディングエージェントの依存の罠:50人規模のローコードショップが12ヶ月で消滅
News

AIコーディングエージェントの依存の罠:50人規模のローコードショップが12ヶ月で消滅

50人のローコード開発会社が12ヶ月で全クライアントを失った。「ローコード+AI」が純粋なローコードやフルスタックを凌駕したからだ。一方、Claude Maxに依存する個人開発者はセッション制限とコスト上昇に直面する。どちらも同じジレンマを示している:適応するか、依存するか。

OpenClawRadar
テネシー州の女性、AI顔認識システムの誤りにより6か月間収監される
News

テネシー州の女性、AI顔認識システムの誤りにより6か月間収監される

50歳のテネシー州の祖母、アンジェラ・リップスは、ファーゴ警察が顔認識ソフトウェアを使用して彼女をノースダコタ州の銀行詐欺事件の容疑者と誤認したため、約6か月間拘置所で過ごしました。犯行時に彼女が現場から約1,200マイル離れた場所にいたことを示す銀行記録が証明された後、クリスマスイブに釈放されました。

OpenClawRadar
英国のAI投資主張に疑問符:幽霊データセンターと未確認資金
News

英国のAI投資主張に疑問符:幽霊データセンターと未確認資金

ガーディアンの調査により、英国の数十億ポンド規模のAI推進計画には、レンタルデータセンターを使った「幽霊投資」、未だに足場置き場として稼働するスーパーコンピューター用地、そして検証されていない雇用創出の主張が含まれていることが明らかになった。

OpenClawRadar
AIエージェントがコードレビューを殺している—プリンシパル=エージェント問題の解説
News

AIエージェントがコードレビューを殺している—プリンシパル=エージェント問題の解説

エージェントを従来のコードレビュープロセスに導入すると、レビューの負担が倍増し、信頼シグナルが崩壊し、持続不可能な不均衡が生まれます——これはソフトウェアエンジニアリングにおけるプリンシパル=エージェント問題です。

OpenClawRadar