Interfaz supera a Gemini-3-Flash y GPT-5.4-Mini en 9 benchmarks

Interfaze es una nueva arquitectura de modelo de Interfaze que fusiona modelos DNN/CNN específicos de tareas con omni-transformers, orientada a tareas deterministas de alta precisión a escala. Ofrece una ventana de contexto de 1 millón de tokens, hasta 32k tokens de salida y admite entradas de texto, imágenes, audio y archivos con razonamiento opcional.

Resultados de Benchmark

Según sus benchmarks, Interfaze lidera frente a modelos de nivel de precio similar (modelos Flash/mini como Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 y Grok-4.3) en 9 pruebas comparativas directas:

OCRBench V2: Interfaze 70.7% vs Gemini-3-Flash 55.8%, Claude-Sonnet-4.6 54.7%, GPT-5.4-Mini 52.7%, Grok-4.3 54.7%
olmOCR: Interfaze 85.7% vs Gemini-3-Flash 75.3%, Claude-Sonnet-4.6 73.9%, GPT-5.4-Mini 80.1%, Grok-4.3 81.9%
RefCOCO: Interfaze 82.1% vs Gemini-3-Flash 75.2%, Claude-Sonnet-4.6 75.5%, GPT-5.4-Mini 67.0%, Grok-4.3 25.0%
VoxPopuli (WER, menor es mejor): Interfaze 2.4% vs Gemini-3-Flash 4.0%
Spider 2.0-Lite: Interfaze 52.9% vs Gemini-3-Flash 45.2%, Claude-Sonnet-4.6 49.6%, GPT-5.4-Mini 26.7%, Grok-4.3 45.9%
GPQA Diamond: Interfaze 89.9% vs Gemini-3-Flash 88.5%, Claude-Sonnet-4.6 89.9%, GPT-5.4-Mini 82.8%, Grok-4.3 73.6%
MMMLU: Interfaze 90.9% vs Gemini-3-Flash 88.7%, Claude-Sonnet-4.6 84.9%, GPT-5.4-Mini 75.3%, Grok-4.3 89.7%
MMMU-Pro: Interfaze 71.1% vs Gemini-3-Flash 67.6%, Claude-Sonnet-4.6 46.3%, GPT-5.4-Mini 40.4%, Grok-4.3 68.7%
SOB Value Acc: Interfaze 79.5% vs Gemini-3-Flash 77.3%, Claude-Sonnet-4.6 77.9%, GPT-5.4-Mini 75.1%, Grok-4.3 78.4%

Interfaze también supera a proveedores especializados de OCR como Chandra OCR y Reducto, según la fuente.

Precios

Interfaze tiene un precio de $1.50 por millón de tokens de entrada y $3.50 por millón de tokens de salida, en línea con Gemini-3-Flash.

Para quién es

Desarrolladores que construyen pipelines de alto volumen de OCR, extracción de documentos, búsqueda web, transcripción de audio/diarización de hablantes, traducción o detección de objetos/GUI que necesitan precisión determinista sin el costo de los LLM completos.

📖 Leer la fuente completa: HN AI Agents

Interfaz: Nueva arquitectura de modelo supera a Gemini-3-Flash y GPT-5.4-Mini en tareas deterministas

Resultados de Benchmark

Precios

Para quién es

👀 Ver también

Bit-Chat: Los Agentes de IA Pueden Enviar Bitcoin a través de Lightning Mediante Plataformas de Mensajería

Agentes Pixel: 24 Agentes Claude Especializados en Revisiones de Código, Sitios Web y Currículums

MTP + Memoria Unificada Aumenta la Inferencia de llama.cpp un 30% en RTX 5090

Servidor MCP de Análisis con Claude Primero: Dando a los Agentes de IA Acceso Directo al Contexto de Analítica Web