Interfaze vs Gemini-3-Flash: Новая архитектура побеждает в 9 бенчмарках

Interfaze — это новая архитектура модели от компании Interfaze, объединяющая специализированные DNN/CNN модели с омни-трансформерами для решения высокоточных детерминированных задач в масштабе. Она предлагает окно контекста в 1 млн токенов, до 32 тыс. выходных токенов и поддерживает ввод текста, изображений, аудио и файлов с возможностью рассуждений.

Результаты бенчмарков

Согласно их тестам, Interfaze опережает модели аналогичного ценового сегмента (Flash/mini модели, такие как Gemini-3-Flash, GPT-5.4-Mini, Claude Sonnet 4.6 и Grok-4.3) в 9 прямых сравнениях:

OCRBench V2: Interfaze 70.7% против Gemini-3-Flash 55.8%, Claude-Sonnet-4.6 54.7%, GPT-5.4-Mini 52.7%, Grok-4.3 54.7%
olmOCR: Interfaze 85.7% против Gemini-3-Flash 75.3%, Claude-Sonnet-4.6 73.9%, GPT-5.4-Mini 80.1%, Grok-4.3 81.9%
RefCOCO: Interfaze 82.1% против Gemini-3-Flash 75.2%, Claude-Sonnet-4.6 75.5%, GPT-5.4-Mini 67.0%, Grok-4.3 25.0%
VoxPopuli (WER, чем ниже, тем лучше): Interfaze 2.4% против Gemini-3-Flash 4.0%
Spider 2.0-Lite: Interfaze 52.9% против Gemini-3-Flash 45.2%, Claude-Sonnet-4.6 49.6%, GPT-5.4-Mini 26.7%, Grok-4.3 45.9%
GPQA Diamond: Interfaze 89.9% против Gemini-3-Flash 88.5%, Claude-Sonnet-4.6 89.9%, GPT-5.4-Mini 82.8%, Grok-4.3 73.6%
MMMLU: Interfaze 90.9% против Gemini-3-Flash 88.7%, Claude-Sonnet-4.6 84.9%, GPT-5.4-Mini 75.3%, Grok-4.3 89.7%
MMMU-Pro: Interfaze 71.1% против Gemini-3-Flash 67.6%, Claude-Sonnet-4.6 46.3%, GPT-5.4-Mini 40.4%, Grok-4.3 68.7%
SOB Value Acc: Interfaze 79.5% против Gemini-3-Flash 77.3%, Claude-Sonnet-4.6 77.9%, GPT-5.4-Mini 75.1%, Grok-4.3 78.4%

Interfaze также превосходит специализированных OCR-провайдеров, таких как Chandra OCR и Reducto, согласно источнику.

Ценообразование

Interfaze стоит $1.50 за миллион входных токенов и $3.50 за миллион выходных токенов — наравне с Gemini-3-Flash.

Для кого это

Для разработчиков, создающих высоконагруженные конвейеры OCR, извлечения документов, веб-поиска, транскрипции аудио/диаризации дикторов, перевода или обнаружения объектов/GUI, которым нужна детерминированная точность без затрат на полноценные LLM.

📖 Читать полный источник: HN AI Agents

Интерфазе: Новая архитектура модели превосходит Gemini-3-Flash и GPT-5.4-Mini в детерминированных задачах

Результаты бенчмарков

Ценообразование

Для кого это

👀 Смотрите также

Упрощение автоматизации с помощью оберток OpenClaw

Солоноватый: Пусть два экземпляра Claude Code согласуют контракт API через OpenAPI 3.1

Сервер Tredict MCP позволяет Claude создавать и отправлять планы тренировок на спортивные часы.

Сервер MCP ExposureGuard добавляет сканирование безопасности доменов в Claude Desktop.