Interfaze : Nouvelle architecture surpasse GPT-5.4 et Gemini-3 sur 9 benchmarks

Interfaze est une nouvelle architecture de modèle développée par Interfaze qui fusionne des modèles DNN/CNN spécialisés par tâche avec des omni-transformeurs, visant des tâches déterministes à haute précision à grande échelle. Elle offre une fenêtre de contexte de 1 million de tokens, un maximum de 32 000 tokens de sortie et prend en charge les entrées texte, image, audio et fichier avec raisonnement optionnel.

Résultats des benchmarks

Selon leurs benchmarks, Interfaze mène face aux modèles de gamme de prix similaire (modèles Flash/mini comme Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 et Grok-4.3) sur 9 tests en tête-à-tête :

OCRBench V2 : Interfaze 70,7 % vs Gemini-3-Flash 55,8 %, Claude-Sonnet-4.6 54,7 %, GPT-5.4-Mini 52,7 %, Grok-4.3 54,7 %
olmOCR : Interfaze 85,7 % vs Gemini-3-Flash 75,3 %, Claude-Sonnet-4.6 73,9 %, GPT-5.4-Mini 80,1 %, Grok-4.3 81,9 %
RefCOCO : Interfaze 82,1 % vs Gemini-3-Flash 75,2 %, Claude-Sonnet-4.6 75,5 %, GPT-5.4-Mini 67,0 %, Grok-4.3 25,0 %
VoxPopuli (WER, plus bas = meilleur) : Interfaze 2,4 % vs Gemini-3-Flash 4,0 %
Spider 2.0-Lite : Interfaze 52,9 % vs Gemini-3-Flash 45,2 %, Claude-Sonnet-4.6 49,6 %, GPT-5.4-Mini 26,7 %, Grok-4.3 45,9 %
GPQA Diamond : Interfaze 89,9 % vs Gemini-3-Flash 88,5 %, Claude-Sonnet-4.6 89,9 %, GPT-5.4-Mini 82,8 %, Grok-4.3 73,6 %
MMMLU : Interfaze 90,9 % vs Gemini-3-Flash 88,7 %, Claude-Sonnet-4.6 84,9 %, GPT-5.4-Mini 75,3 %, Grok-4.3 89,7 %
MMMU-Pro : Interfaze 71,1 % vs Gemini-3-Flash 67,6 %, Claude-Sonnet-4.6 46,3 %, GPT-5.4-Mini 40,4 %, Grok-4.3 68,7 %
SOB Value Acc : Interfaze 79,5 % vs Gemini-3-Flash 77,3 %, Claude-Sonnet-4.6 77,9 %, GPT-5.4-Mini 75,1 %, Grok-4.3 78,4 %

Interfaze surpasse également des fournisseurs spécialisés en OCR comme Chandra OCR et Reducto, selon la source.

Tarification

Interfaze est proposé à 1,50 $ par million de tokens en entrée et 3,50 $ par million de tokens en sortie — aligné sur Gemini-3-Flash.

À qui cela s'adresse

Les développeurs construisant des pipelines à grand volume d'OCR, d'extraction de documents, de recherche web, de transcription audio/diarisation des locuteurs, de traduction ou de détection d'objets/interfaces GUI qui ont besoin de précision déterministe sans le coût des LLM complets.

📖 Lire la source complète : HN AI Agents

Interfaze : Une nouvelle architecture de modèle surpasse Gemini-3-Flash et GPT-5.4-Mini sur les tâches déterministes

Résultats des benchmarks

Tarification

À qui cela s'adresse

👀 See Also

Claude Code charge paresseusement les schémas d'outils via ToolSearch pour économiser des tokens

Facture de Compétences : Un Cadre de Gouvernance Basé sur Markdown pour les Compétences en Codage IA

Hermes Agent v0.6.0 propose une meilleure prise en charge des modèles locaux avec des analyseurs d'appels d'outils par modèle.

Autoencodeurs de langage naturel : Transformer les représentations internes de Claude en texte