Interfaze: Neue Modellarchitektur übertrifft Gemini-3-Flash und GPT-5.4-Mini bei deterministischen Aufgaben

Interfaze ist eine neue Modellarchitektur von Interfaze, die aufgabenspezifische DNN/CNN-Modelle mit Omni-Transformatoren vereint und auf hochpräzise deterministische Aufgaben in großem Maßstab abzielt. Es bietet ein Kontextfenster von 1 Million Token, maximal 32.000 Ausgabetoken und unterstützt Text-, Bild-, Audio- und Dateieingaben mit optionalem Reasoning.
Benchmark-Ergebnisse
Laut ihren Benchmarks liegt Interfaze in 9 direkten Vergleichen vor ähnlich teuren Modellen (Flash-/Mini-Modelle wie Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 und Grok-4.3):
- OCRBench V2: Interfaze 70,7 % vs. Gemini-3-Flash 55,8 %, Claude-Sonnet-4.6 54,7 %, GPT-5.4-Mini 52,7 %, Grok-4.3 54,7 %
- olmOCR: Interfaze 85,7 % vs. Gemini-3-Flash 75,3 %, Claude-Sonnet-4.6 73,9 %, GPT-5.4-Mini 80,1 %, Grok-4.3 81,9 %
- RefCOCO: Interfaze 82,1 % vs. Gemini-3-Flash 75,2 %, Claude-Sonnet-4.6 75,5 %, GPT-5.4-Mini 67,0 %, Grok-4.3 25,0 %
- VoxPopuli (WER, niedriger ist besser): Interfaze 2,4 % vs. Gemini-3-Flash 4,0 %
- Spider 2.0-Lite: Interfaze 52,9 % vs. Gemini-3-Flash 45,2 %, Claude-Sonnet-4.6 49,6 %, GPT-5.4-Mini 26,7 %, Grok-4.3 45,9 %
- GPQA Diamond: Interfaze 89,9 % vs. Gemini-3-Flash 88,5 %, Claude-Sonnet-4.6 89,9 %, GPT-5.4-Mini 82,8 %, Grok-4.3 73,6 %
- MMMLU: Interfaze 90,9 % vs. Gemini-3-Flash 88,7 %, Claude-Sonnet-4.6 84,9 %, GPT-5.4-Mini 75,3 %, Grok-4.3 89,7 %
- MMMU-Pro: Interfaze 71,1 % vs. Gemini-3-Flash 67,6 %, Claude-Sonnet-4.6 46,3 %, GPT-5.4-Mini 40,4 %, Grok-4.3 68,7 %
- SOB Value Acc: Interfaze 79,5 % vs. Gemini-3-Flash 77,3 %, Claude-Sonnet-4.6 77,9 %, GPT-5.4-Mini 75,1 %, Grok-4.3 78,4 %
Interfaze übertrifft laut Quelle auch spezialisierte OCR-Anbieter wie Chandra OCR und Reducto.
Preise
Interfaze kostet 1,50 $ pro Million Eingabe-Token und 3,50 $ pro Million Ausgabe-Token – auf dem Niveau von Gemini-3-Flash.
Zielgruppe
Entwickler, die umfangreiche OCR-, Dokumentenextraktions-, Websuch-, Audio-Transkriptions-/Sprecher-Diarisierungs-, Übersetzungs- oder Objekt-/GUI-Erkennungspipelines erstellen und dabei deterministische Genauigkeit ohne die Kosten vollständiger LLMs benötigen.
📖 Vollständige Quelle lesen: HN AI Agents
👀 Siehe auch

JavaClaw Beta: Java-basierter KI-Assistent auf Basis von Spring AI und JobRunr
Das JobRunr-Team hat JavaClaw Beta veröffentlicht, eine Java-Version von OpenClaw, die lokal mit Mehrkanalunterstützung, LLM-Auswahl und Hintergrundjobverarbeitung via JobRunr läuft. Entwickelt mit Spring Boot 4, Spring AI und Spring Modulith.

pop-pay MCP-Server fügt Zahlungs-Sicherheitsvorkehrungen für Claude Code-Agents hinzu
pop-pay ist ein MCP-Server, der es Claude Code-Agenten ermöglicht, Einkäufe zu tätigen, ohne Kreditkartennummern preiszugeben. Er nutzt CDP-Injektion, um virtuelle Kartendaten direkt in Zahlungs-Iframes einzufügen, wobei Claude nur maskierte Bestätigungsnummern erhält.

Open-Source-Framework nutzt Claude Code CLI zur automatisierten Überwachung von GitHub-Repositories
Ein Entwickler hat ein Framework quelloffen gemacht, das Claude Code CLI nach einem Cron-Zeitplan ausführt, um GitHub-Aktivitäten über mehrere Repositories hinweg zu sichten. Das Tool umfasst Zustandsverfolgung, Deduplizierung, Discord-Benachrichtigungen und ein Vorabprüfsystem, das API-Kosten vermeidet, wenn sich nichts geändert hat.

Solitaire: Open-Source Identitätsschicht für KI-Agenten, entwickelt mit Claude Code
Solitaire ist eine Open-Source-Identitätsschicht für KI-Agenten, die sich durch Interaktion statt statischer Konfiguration entwickelt. Sie wurde in über 600 Produktionssitzungen getestet und speichert alle Daten lokal mit SQLite + JSONL ohne Cloud-Abhängigkeiten.