Interfaze Nova Arquitetura Supera Gemini-3-Flash e GPT-5.4-Mini em 9 Benchmarks

Interfaze é uma nova arquitetura de modelo da Interfaze que mescla modelos DNN/CNN específicos de tarefa com omni-transformers, visando tarefas determinísticas de alta precisão em escala. Oferece uma janela de contexto de 1 milhão de tokens, máximo de 32 mil tokens de saída e suporta entradas de texto, imagens, áudio e arquivos com raciocínio opcional.

Resultados dos Benchmarks

De acordo com seus benchmarks, o Interfaze lidera contra modelos de faixa de preço similar (modelos Flash/mini como Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 e Grok-4.3) em 9 testes comparativos:

OCRBench V2: Interfaze 70,7% vs Gemini-3-Flash 55,8%, Claude-Sonnet-4.6 54,7%, GPT-5.4-Mini 52,7%, Grok-4.3 54,7%
olmOCR: Interfaze 85,7% vs Gemini-3-Flash 75,3%, Claude-Sonnet-4.6 73,9%, GPT-5.4-Mini 80,1%, Grok-4.3 81,9%
RefCOCO: Interfaze 82,1% vs Gemini-3-Flash 75,2%, Claude-Sonnet-4.6 75,5%, GPT-5.4-Mini 67,0%, Grok-4.3 25,0%
VoxPopuli (WER, menor é melhor): Interfaze 2,4% vs Gemini-3-Flash 4,0%
Spider 2.0-Lite: Interfaze 52,9% vs Gemini-3-Flash 45,2%, Claude-Sonnet-4.6 49,6%, GPT-5.4-Mini 26,7%, Grok-4.3 45,9%
GPQA Diamond: Interfaze 89,9% vs Gemini-3-Flash 88,5%, Claude-Sonnet-4.6 89,9%, GPT-5.4-Mini 82,8%, Grok-4.3 73,6%
MMMLU: Interfaze 90,9% vs Gemini-3-Flash 88,7%, Claude-Sonnet-4.6 84,9%, GPT-5.4-Mini 75,3%, Grok-4.3 89,7%
MMMU-Pro: Interfaze 71,1% vs Gemini-3-Flash 67,6%, Claude-Sonnet-4.6 46,3%, GPT-5.4-Mini 40,4%, Grok-4.3 68,7%
SOB Value Acc: Interfaze 79,5% vs Gemini-3-Flash 77,3%, Claude-Sonnet-4.6 77,9%, GPT-5.4-Mini 75,1%, Grok-4.3 78,4%

O Interfaze também supera fornecedores especializados de OCR como Chandra OCR e Reducto, de acordo com a fonte.

Preços

O Interfaze tem o preço de $1,50 por milhão de tokens de entrada e $3,50 por milhão de tokens de saída — alinhado com o Gemini-3-Flash.

Para Quem Serve

Desenvolvedores que constroem pipelines de alto volume de OCR, extração de documentos, pesquisa web, transcrição de áudio/diarização de locutores, tradução ou detecção de objetos/GUI que precisam de precisão determinística sem o custo de LLMs completos.

📖 Leia a fonte original: HN AI Agents

Interfaze: Nova Arquitetura de Modelo Supera Gemini-3-Flash e GPT-5.4-Mini em Tarefas Determinísticas

Resultados dos Benchmarks

Preços

Para Quem Serve

👀 See Also

Agente de revisão de PR open source PrixAI detecta 10/10 bugs plantados a um custo 6x menor que o CodeRabbit

Comandante de Frota: Painel de controle de código aberto para orquestrar múltiplas equipes de agentes Claude Code

Top 6 Habilidades Open Source do Claude (15 de abril a 3 de maio)

Comparação de Desempenho de 88 Modelos GGUF Pequenos em um Mac Mini M4 de 16GB