Interfaze: Neue Architektur schlägt GPT-5.4-Mini & Gemini-3-Flash

Interfaze ist eine neue Modellarchitektur von Interfaze, die aufgabenspezifische DNN/CNN-Modelle mit Omni-Transformatoren vereint und auf hochpräzise deterministische Aufgaben in großem Maßstab abzielt. Es bietet ein Kontextfenster von 1 Million Token, maximal 32.000 Ausgabetoken und unterstützt Text-, Bild-, Audio- und Dateieingaben mit optionalem Reasoning.

Benchmark-Ergebnisse

Laut ihren Benchmarks liegt Interfaze in 9 direkten Vergleichen vor ähnlich teuren Modellen (Flash-/Mini-Modelle wie Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 und Grok-4.3):

OCRBench V2: Interfaze 70,7 % vs. Gemini-3-Flash 55,8 %, Claude-Sonnet-4.6 54,7 %, GPT-5.4-Mini 52,7 %, Grok-4.3 54,7 %
olmOCR: Interfaze 85,7 % vs. Gemini-3-Flash 75,3 %, Claude-Sonnet-4.6 73,9 %, GPT-5.4-Mini 80,1 %, Grok-4.3 81,9 %
RefCOCO: Interfaze 82,1 % vs. Gemini-3-Flash 75,2 %, Claude-Sonnet-4.6 75,5 %, GPT-5.4-Mini 67,0 %, Grok-4.3 25,0 %
VoxPopuli (WER, niedriger ist besser): Interfaze 2,4 % vs. Gemini-3-Flash 4,0 %
Spider 2.0-Lite: Interfaze 52,9 % vs. Gemini-3-Flash 45,2 %, Claude-Sonnet-4.6 49,6 %, GPT-5.4-Mini 26,7 %, Grok-4.3 45,9 %
GPQA Diamond: Interfaze 89,9 % vs. Gemini-3-Flash 88,5 %, Claude-Sonnet-4.6 89,9 %, GPT-5.4-Mini 82,8 %, Grok-4.3 73,6 %
MMMLU: Interfaze 90,9 % vs. Gemini-3-Flash 88,7 %, Claude-Sonnet-4.6 84,9 %, GPT-5.4-Mini 75,3 %, Grok-4.3 89,7 %
MMMU-Pro: Interfaze 71,1 % vs. Gemini-3-Flash 67,6 %, Claude-Sonnet-4.6 46,3 %, GPT-5.4-Mini 40,4 %, Grok-4.3 68,7 %
SOB Value Acc: Interfaze 79,5 % vs. Gemini-3-Flash 77,3 %, Claude-Sonnet-4.6 77,9 %, GPT-5.4-Mini 75,1 %, Grok-4.3 78,4 %

Interfaze übertrifft laut Quelle auch spezialisierte OCR-Anbieter wie Chandra OCR und Reducto.

Preise

Interfaze kostet 1,50 $ pro Million Eingabe-Token und 3,50 $ pro Million Ausgabe-Token – auf dem Niveau von Gemini-3-Flash.

Zielgruppe

Entwickler, die umfangreiche OCR-, Dokumentenextraktions-, Websuch-, Audio-Transkriptions-/Sprecher-Diarisierungs-, Übersetzungs- oder Objekt-/GUI-Erkennungspipelines erstellen und dabei deterministische Genauigkeit ohne die Kosten vollständiger LLMs benötigen.

📖 Vollständige Quelle lesen: HN AI Agents

Interfaze: Neue Modellarchitektur übertrifft Gemini-3-Flash und GPT-5.4-Mini bei deterministischen Aufgaben

Benchmark-Ergebnisse

Preise

Zielgruppe

👀 Siehe auch

AgentLens: Beobachtungstool für Multi-Agenten-KI-Workflows

Open-Source-MCP-Server verbindet Claude mit der Mailchimp-API

Claude Code fügt Multi-Agenten-Code-Review-System hinzu

ToolLoop: Open-Source-Framework für Claude-ähnliche Tools mit jedem LLM