Interfaze : Une nouvelle architecture de modèle surpasse Gemini-3-Flash et GPT-5.4-Mini sur les tâches déterministes

Interfaze est une nouvelle architecture de modèle développée par Interfaze qui fusionne des modèles DNN/CNN spécialisés par tâche avec des omni-transformeurs, visant des tâches déterministes à haute précision à grande échelle. Elle offre une fenêtre de contexte de 1 million de tokens, un maximum de 32 000 tokens de sortie et prend en charge les entrées texte, image, audio et fichier avec raisonnement optionnel.
Résultats des benchmarks
Selon leurs benchmarks, Interfaze mène face aux modèles de gamme de prix similaire (modèles Flash/mini comme Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 et Grok-4.3) sur 9 tests en tête-à-tête :
- OCRBench V2 : Interfaze 70,7 % vs Gemini-3-Flash 55,8 %, Claude-Sonnet-4.6 54,7 %, GPT-5.4-Mini 52,7 %, Grok-4.3 54,7 %
- olmOCR : Interfaze 85,7 % vs Gemini-3-Flash 75,3 %, Claude-Sonnet-4.6 73,9 %, GPT-5.4-Mini 80,1 %, Grok-4.3 81,9 %
- RefCOCO : Interfaze 82,1 % vs Gemini-3-Flash 75,2 %, Claude-Sonnet-4.6 75,5 %, GPT-5.4-Mini 67,0 %, Grok-4.3 25,0 %
- VoxPopuli (WER, plus bas = meilleur) : Interfaze 2,4 % vs Gemini-3-Flash 4,0 %
- Spider 2.0-Lite : Interfaze 52,9 % vs Gemini-3-Flash 45,2 %, Claude-Sonnet-4.6 49,6 %, GPT-5.4-Mini 26,7 %, Grok-4.3 45,9 %
- GPQA Diamond : Interfaze 89,9 % vs Gemini-3-Flash 88,5 %, Claude-Sonnet-4.6 89,9 %, GPT-5.4-Mini 82,8 %, Grok-4.3 73,6 %
- MMMLU : Interfaze 90,9 % vs Gemini-3-Flash 88,7 %, Claude-Sonnet-4.6 84,9 %, GPT-5.4-Mini 75,3 %, Grok-4.3 89,7 %
- MMMU-Pro : Interfaze 71,1 % vs Gemini-3-Flash 67,6 %, Claude-Sonnet-4.6 46,3 %, GPT-5.4-Mini 40,4 %, Grok-4.3 68,7 %
- SOB Value Acc : Interfaze 79,5 % vs Gemini-3-Flash 77,3 %, Claude-Sonnet-4.6 77,9 %, GPT-5.4-Mini 75,1 %, Grok-4.3 78,4 %
Interfaze surpasse également des fournisseurs spécialisés en OCR comme Chandra OCR et Reducto, selon la source.
Tarification
Interfaze est proposé à 1,50 $ par million de tokens en entrée et 3,50 $ par million de tokens en sortie — aligné sur Gemini-3-Flash.
À qui cela s'adresse
Les développeurs construisant des pipelines à grand volume d'OCR, d'extraction de documents, de recherche web, de transcription audio/diarisation des locuteurs, de traduction ou de détection d'objets/interfaces GUI qui ont besoin de précision déterministe sans le coût des LLM complets.
📖 Lire la source complète : HN AI Agents
👀 See Also

Script PowerShell Automatise la Configuration de Docker OpenClaw sur Windows
Un script PowerShell gère les particularités réseau spécifiques à Windows et la configuration Docker pour OpenClaw, automatisant les vérifications, la récupération d'images, les instructions de configuration et le déploiement de conteneurs.

Atoo Studio : Espace de travail open source pour gérer des flux de travail Claude Code multi-projets
Atoo Studio est un espace de travail open-source conçu pour résoudre le chaos des terminaux et des onglets lors de l'utilisation de Claude Code sur plusieurs projets. Il introduit le forking de sessions comme les branches Git et permet la continuité entre Claude Code, Codex CLI et Gemini CLI.

Miasma : Un outil pour piéger les robots d'indexation d'IA avec des données empoisonnées
Miasma est un outil serveur qui envoie des données d'entraînement empoisonnées et des liens autoréférentiels aux aspirateurs web d'IA, créant une boucle sans fin. Il fonctionne avec une empreinte mémoire minimale et peut être configuré via des options CLI incluant le port, l'hôte et le préfixe de lien.

Nelson v2.2.3 publiée : coordination multi-agents pour Claude Code, plus un benchmark de simulation à événements discrets
Nelson v2.2.3 intègre une compétence de coordination multi-agents pour Claude Code, basée sur une métaphore navale. Un benchmark de 13 configurations montre qu'opus-4-7 avec réflexion domine ; le choix de la compétence a un impact moindre.