日本語訳: 新モデルアーキテクチャ「Interfaze」、決定論的タスクでGemini-3-FlashとGPT-5.4-Miniを凌駕

Interfazeは、Interfaze社が開発した新しいモデルアーキテクチャで、タスク固有のDNN/CNNモデルとオムニトランスフォーマーを統合し、高精度な決定論的タスクを大規模に処理することを目的としています。100万トークンのコンテキストウィンドウ、最大32,000トークンの出力を備え、テキスト、画像、音声、ファイル入力に対応し、オプションで推論機能も提供します。
ベンチマーク結果
同社のベンチマークによると、Interfazeは同価格帯のモデル(Gemini-3-Flash、GPT-5.4-Mini、Claude Sonnet 4.6、Grok-4.3などのFlash/ミニモデル)との9つの直接比較テストにおいてリードしています:
- OCRBench V2:Interfaze 70.7% vs Gemini-3-Flash 55.8%、Claude-Sonnet-4.6 54.7%、GPT-5.4-Mini 52.7%、Grok-4.3 54.7%
- olmOCR:Interfaze 85.7% vs Gemini-3-Flash 75.3%、Claude-Sonnet-4.6 73.9%、GPT-5.4-Mini 80.1%、Grok-4.3 81.9%
- RefCOCO:Interfaze 82.1% vs Gemini-3-Flash 75.2%、Claude-Sonnet-4.6 75.5%、GPT-5.4-Mini 67.0%、Grok-4.3 25.0%
- VoxPopuli(WER、低いほど良い):Interfaze 2.4% vs Gemini-3-Flash 4.0%
- Spider 2.0-Lite:Interfaze 52.9% vs Gemini-3-Flash 45.2%、Claude-Sonnet-4.6 49.6%、GPT-5.4-Mini 26.7%、Grok-4.3 45.9%
- GPQA Diamond:Interfaze 89.9% vs Gemini-3-Flash 88.5%、Claude-Sonnet-4.6 89.9%、GPT-5.4-Mini 82.8%、Grok-4.3 73.6%
- MMMLU:Interfaze 90.9% vs Gemini-3-Flash 88.7%、Claude-Sonnet-4.6 84.9%、GPT-5.4-Mini 75.3%、Grok-4.3 89.7%
- MMMU-Pro:Interfaze 71.1% vs Gemini-3-Flash 67.6%、Claude-Sonnet-4.6 46.3%、GPT-5.4-Mini 40.4%、Grok-4.3 68.7%
- SOB Value Acc:Interfaze 79.5% vs Gemini-3-Flash 77.3%、Claude-Sonnet-4.6 77.9%、GPT-5.4-Mini 75.1%、Grok-4.3 78.4%
また、情報源によると、InterfazeはChandra OCRやReductoといった専門のOCRプロバイダーも上回っています。
料金
Interfazeの料金は、入力トークン100万あたり1.50ドル、出力トークン100万あたり3.50ドルで、Gemini-3-Flashと同程度です。
対象ユーザー
大量のOCR、ドキュメント抽出、ウェブ検索、音声文字起こし/話者識別、翻訳、またはオブジェクト/GUI検出パイプラインを構築する開発者で、完全なLLMのコストをかけずに決定論的な精度を必要とする方に適しています。
📖 全文はこちら: Source
👀 See Also

OnPrem.LLM エージェントエグゼキューター:組み込みツールを備えたサンドボックス化AIエージェントを起動
OnPrem.LLMのAgentExecutorは、クラウドまたはローカルモデルを使用して複雑なタスクを実行する自律型AIエージェントを作成できます。ファイル操作、シェルコマンド、ウェブ検索を含む9つの組み込みツールを備えており、セキュリティのためにサンドボックス化されたコンテナでエージェントを実行することも可能です。

クロードはインタラクティブなチャートとダイアグラム作成機能を追加しました
Claudeは現在、会話内で直接チャート、図表、探索可能な詳細情報を含むインタラクティブなビジュアルを生成できるようになりました。この機能は無料プランを含むすべてのプランでベータ版として利用可能です。

ギャリー・タンのgstack:Claude CodeのためのオープンソースAIエージェントフレームワーク
ギャリー・タンのgstackは、Claude Codeを仮想エンジニアリングチームに変えるオープンソースのソフトウェアファクトリーで、計画、設計、エンジニアリング、レビュー、QA、リリース管理のための13の専門スラッシュコマンドを備えています。

Chromeスキル:AIプロンプトをワンクリックツールとして保存・再利用
GoogleのChromeスキル機能は、ユーザーがAIプロンプトを再利用可能なワークフローとして保存し、任意のウェブページでワンクリックで実行できるようにします。スキルは、ChromeのGeminiでスラッシュ(/)を入力するか、プラス記号(+)をクリックすることでアクセスできます。