Interfaze: Neue Modellarchitektur übertrifft Gemini-3-Flash und GPT-5.4-Mini bei deterministischen Aufgaben

✍️ OpenClawRadar📅 Veröffentlicht: 11. Mai 2026🔗 Source
Interfaze: Neue Modellarchitektur übertrifft Gemini-3-Flash und GPT-5.4-Mini bei deterministischen Aufgaben
Ad

Interfaze ist eine neue Modellarchitektur von Interfaze, die aufgabenspezifische DNN/CNN-Modelle mit Omni-Transformatoren vereint und auf hochpräzise deterministische Aufgaben in großem Maßstab abzielt. Es bietet ein Kontextfenster von 1 Million Token, maximal 32.000 Ausgabetoken und unterstützt Text-, Bild-, Audio- und Dateieingaben mit optionalem Reasoning.

Benchmark-Ergebnisse

Laut ihren Benchmarks liegt Interfaze in 9 direkten Vergleichen vor ähnlich teuren Modellen (Flash-/Mini-Modelle wie Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 und Grok-4.3):

  • OCRBench V2: Interfaze 70,7 % vs. Gemini-3-Flash 55,8 %, Claude-Sonnet-4.6 54,7 %, GPT-5.4-Mini 52,7 %, Grok-4.3 54,7 %
  • olmOCR: Interfaze 85,7 % vs. Gemini-3-Flash 75,3 %, Claude-Sonnet-4.6 73,9 %, GPT-5.4-Mini 80,1 %, Grok-4.3 81,9 %
  • RefCOCO: Interfaze 82,1 % vs. Gemini-3-Flash 75,2 %, Claude-Sonnet-4.6 75,5 %, GPT-5.4-Mini 67,0 %, Grok-4.3 25,0 %
  • VoxPopuli (WER, niedriger ist besser): Interfaze 2,4 % vs. Gemini-3-Flash 4,0 %
  • Spider 2.0-Lite: Interfaze 52,9 % vs. Gemini-3-Flash 45,2 %, Claude-Sonnet-4.6 49,6 %, GPT-5.4-Mini 26,7 %, Grok-4.3 45,9 %
  • GPQA Diamond: Interfaze 89,9 % vs. Gemini-3-Flash 88,5 %, Claude-Sonnet-4.6 89,9 %, GPT-5.4-Mini 82,8 %, Grok-4.3 73,6 %
  • MMMLU: Interfaze 90,9 % vs. Gemini-3-Flash 88,7 %, Claude-Sonnet-4.6 84,9 %, GPT-5.4-Mini 75,3 %, Grok-4.3 89,7 %
  • MMMU-Pro: Interfaze 71,1 % vs. Gemini-3-Flash 67,6 %, Claude-Sonnet-4.6 46,3 %, GPT-5.4-Mini 40,4 %, Grok-4.3 68,7 %
  • SOB Value Acc: Interfaze 79,5 % vs. Gemini-3-Flash 77,3 %, Claude-Sonnet-4.6 77,9 %, GPT-5.4-Mini 75,1 %, Grok-4.3 78,4 %

Interfaze übertrifft laut Quelle auch spezialisierte OCR-Anbieter wie Chandra OCR und Reducto.

Ad

Preise

Interfaze kostet 1,50 $ pro Million Eingabe-Token und 3,50 $ pro Million Ausgabe-Token – auf dem Niveau von Gemini-3-Flash.

Zielgruppe

Entwickler, die umfangreiche OCR-, Dokumentenextraktions-, Websuch-, Audio-Transkriptions-/Sprecher-Diarisierungs-, Übersetzungs- oder Objekt-/GUI-Erkennungspipelines erstellen und dabei deterministische Genauigkeit ohne die Kosten vollständiger LLMs benötigen.

📖 Vollständige Quelle lesen: HN AI Agents

Ad

👀 Siehe auch

JavaClaw Beta: Java-basierter KI-Assistent auf Basis von Spring AI und JobRunr
Werkzeuge

JavaClaw Beta: Java-basierter KI-Assistent auf Basis von Spring AI und JobRunr

Das JobRunr-Team hat JavaClaw Beta veröffentlicht, eine Java-Version von OpenClaw, die lokal mit Mehrkanalunterstützung, LLM-Auswahl und Hintergrundjobverarbeitung via JobRunr läuft. Entwickelt mit Spring Boot 4, Spring AI und Spring Modulith.

OpenClawRadar
pop-pay MCP-Server fügt Zahlungs-Sicherheitsvorkehrungen für Claude Code-Agents hinzu
Werkzeuge

pop-pay MCP-Server fügt Zahlungs-Sicherheitsvorkehrungen für Claude Code-Agents hinzu

pop-pay ist ein MCP-Server, der es Claude Code-Agenten ermöglicht, Einkäufe zu tätigen, ohne Kreditkartennummern preiszugeben. Er nutzt CDP-Injektion, um virtuelle Kartendaten direkt in Zahlungs-Iframes einzufügen, wobei Claude nur maskierte Bestätigungsnummern erhält.

OpenClawRadar
Open-Source-Framework nutzt Claude Code CLI zur automatisierten Überwachung von GitHub-Repositories
Werkzeuge

Open-Source-Framework nutzt Claude Code CLI zur automatisierten Überwachung von GitHub-Repositories

Ein Entwickler hat ein Framework quelloffen gemacht, das Claude Code CLI nach einem Cron-Zeitplan ausführt, um GitHub-Aktivitäten über mehrere Repositories hinweg zu sichten. Das Tool umfasst Zustandsverfolgung, Deduplizierung, Discord-Benachrichtigungen und ein Vorabprüfsystem, das API-Kosten vermeidet, wenn sich nichts geändert hat.

OpenClawRadar
Solitaire: Open-Source Identitätsschicht für KI-Agenten, entwickelt mit Claude Code
Werkzeuge

Solitaire: Open-Source Identitätsschicht für KI-Agenten, entwickelt mit Claude Code

Solitaire ist eine Open-Source-Identitätsschicht für KI-Agenten, die sich durch Interaktion statt statischer Konfiguration entwickelt. Sie wurde in über 600 Produktionssitzungen getestet und speichert alle Daten lokal mit SQLite + JSONL ohne Cloud-Abhängigkeiten.

OpenClawRadar